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Linux 是 一 种 性 能 稳定 的 多 用 户 网 络 操作 系统 ， 它 与 UNIX 系统 有 相似 的 文件 结构 、 用 户 接 
和 操作 方式 。Linux 虽然 是 开源 免费 的 操作 系统 ， 但 它 继承 了 UNIX 系统 强大 的 功能 、 卓 越 的 性 能 
和 稳定 性 。 学 习 Linux 系统 编程 不 仅 能 帮助 学 生 更 好 地 巩固 和 理解 操作 系统 的 工作 原理 ， 还 能 培养 
学 生 的 实践 技能 。 因 此 ， 很 多 高 校 选择 Linux 系统 作为 操作 系统 原理 课程 的 实例 系统 ， 选 用 Linux 
系统 编程 项 目 作为 操作 系统 原理 课程 的 实验 内 容 。 

由 于 Linux 系统 编程 本 身 就 是 一 门 难度 较 大 、 内 容 繁多 的 课程 ， 从 中 选取 一 些 项 目 来 开设 操作 
系统 实验 ， 存 在 以 下 一 些 问题 : (CDLinux 系统 本 身 涉及 很 多 理论 、 概 念 、 技 术 、 算 法 ， 操 作 系统 这 
门 课 一 般 仅 有 十 多 个 实验 学 时 ， 由 于 学 时 太 少 ， 学 生 很 难 较 好 地 掌握 Linux 系统 编程 技术 ， 教 学 效 
果 不 佳 ， @ 目 前 很 难 找到 将 Linux 系统 编程 技术 与 操作 系统 理论 很 好 地 融合 的 教材 ， 结 果 是 学 习 操 
作 系 统 理论 对 学 习 Linux 系统 编程 帮助 不 是 很 大 ， 学 习 Linux 系统 编程 对 理解 操作 系统 的 理论 帮助 
作用 也 非常 有 限 ，@@ 一 般 基 于 Linux 的 实验 指导 或 实验 教材 都 写 得 比较 简略 ， 对 Linux 系统 中 多 进 
程 并 发 、 线 程 编程 、IO 操作 的 介绍 不 完整 、 不 系统 ， 也 没有 补充 必要 的 C 语言 语法 知识 ， 导 致 学 
生 在 学 习 过 程 中 遇 到 很 多 难以 克服 的 困难 ， 关 失学 习 兴趣 和 信心 。 

本 书 内容 丰 富 、 结 构 合理 、 思 路 清晰 、 语 言 简练 流畅 、 示 例 翔实 。 每 一 章 的 引言 部 分 概述 了 该 
章 的 作用 和 内 容 。 在 每 一 章 的 正文 中 ， 结 合 所 讲述 的 关键 技术 和 难点 ， 穿 插 了 大 量 极 富 实用 价值 的 
示例 ， 并 安排 了 有 针对 性 的 思考 和 练习 ， 以 帮助 读者 理解 相关 概念 。 每 一 章 的 末尾 都 安排 了 丰富 的 
课 后 作业 ， 有 助 于 培养 读者 的 分 析 能 力 和 实际 应 用 能 力 。 

本 书 的 目的 是 培养 学 生 关 于 计算 机 系统 的 知识 和 能 力 , 对 操作 系统 和 Linux 系统 编程 进行 整合 ， 
以 Linux 系统 编程 为 主线 ， 并 纳入 操作 系统 原理 课程 中 的 进程 管理 、 信 号 量 与 P/V 操作 、 文 件 系统 
等 部 分 内 容 ， 将 理论 和 实践 有 机 地 融合 起 来 ， 可 作为 独立 的 操作 系统 实验 或 Linux 系统 编程 课程 开 
设 ， 通 过 实践 更 好 地 理解 课程 理论 ， 以 提高 教学 质量 。 
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第 1 章 
Linux 系 统 文件 操作 


本 章 主要 介绍 Linux 系统 的 基本 知识 , 包括 Linux 系统 简介 、Linux 系统 的 目录 结构 、 文 件 类 型 、 
文件 权限 、Linux 命令 格式 以 及 文件 目录 的 基本 操作 ， 为 在 Linux 环境 下 进行 编程 打下 基础 。 


本 章 学 习 目标 : 

了 解 UNIX 与 Linux 系统 的 基本 特点 和 发 展 历程 
理解 Linux 系统 的 目录 结构 

掌握 Linux 系统 的 安装 、 启 动 、 登 录 方 法 

掌握 Linux 文件 属性 和 权限 概念 

掌握 Linux 文件 路 径 的 概念 和 通配符 的 含义 
掌握 常用 的 Linux 文件 与 目录 操作 命令 

掌握 Linux 文件 的 打包 及 解 包 方 法 

理解 IO 重 定向 和 管道 的 功能 及 基本 概念 


IE UNIX/Linux 操作 系统 简介 


1.1.1 UNIX 简介 


1969 年 , Bell Labs( 贝 尔 实验 室 ) 的 Ken Thompson 和 Dennis Ritchie 出 于 兴趣 开发 了 一 种 多 用 户 、 
多 任务 、 多 层次 的 操作 系统 UNIX，1971 年 完成 第 一 版 的 开发 ， 实 现 了 多 任务 管理 、 文 件 操作 、 网 
络 通信 功能 ， 性 能 优越 。 

1973 年 , Dennis Ritchie 创造 了 C 语言 , 与 Ken Thompson 一 起 用 C 语言 重 写 了 UNIX 的 第 三 版 
内 核 ,使 维护 和 移植 变 得 便利 , 得 到 科研 机 构 与 企业 的 大 力 支持 ,逐渐 形成 UNIX AT&T System V 
Release 4(SVR4) 和 BSD 两 个 版 本 系列 : 

@ 加利福尼亚 大 学 Berkeley 分 校 于 1978 年 开发 出 研究 版 本 BSD UNIX， 于 1994 年 开发 出 4.4 

BSD 版 本 ， 并 成 为 现代 BSD 基本 版 本 。 
e@ AT&T 于 1983 年 开发 出 商业 版 本 System V 版 本 1, System V 版 本 4( 称 为 SVR4) 大 获 成 功 ， 


基于 SVR4 造就 7 BM 的 AIX 和 HP 的 HP-UX。 

UNIX 系统 在 金融 、 教 育 、 科 研 、 军 事 等 领域 获得 广泛 应 用 ， 成 为 大 学 师 生 研 究 、 学 习 操 作 系 
统 原理 首选 的 实例 系统 。UNIX 的 主要 版 本 有 以 下 几 种 。 

(1) AIX: IBM 基于 SVR4 开发 的 一 套 UNIX 操作 系统 ， 性 能 高 、 安 全 、 可 靠 性 高 ， 被 广泛 用 于 
银行 领域 。 

(2) Solaris: Sun Microsystems 于 1982 年 推出 基于 BSD UNIX 的 Sun OS, 随后 在 接口 上 向 SVR4 
靠拢 ， 新 版 本 称 为 Solaris， 性 能 高 、 处 理 能 力 强 ， 有 GUI， 在 高 校 、 科 研 院 所 用 得 多 。 

(3) HP-UX: 惠普 (HP) 公 司 以 SVR4 为 基础 研发 出 的 类 UNIX 操作 系统 。 

(4) IRIX: SGI 公司 以 SVR4 与 BSD 延伸 程序 为 基础 研发 出 的 UNIX 操作 系统 ， 具 有 很 强 的 图 
形 处 理 功能 ， 在 游戏 设计 中 使 用 广泛 的 三 维 图 形 编程 库 OpenGL 从 此 而 来 。 

尽管 UNIX 系统 具有 技术 先进 、 性 能 高 、 安 全 性 好 等 优点 ， 但 UNIX 的 不 同 版 本 间 不 兼容 ， 给 
应 用 开发 带 来 极 大 负担 。 搭 建 UNIX 系统 也 涉及 非常 昂贵 的 费用 ， 计 算 机 硬件 、UNIX 系统 、 开 发 
工具 、 应 用 软件 都 需要 分 别 计 费 ， 通 常 搭建 一 套 带 开发 系统 的 UNIX 工作 站 的 费用 达 数 十 万 元 ， 很 
多 用 户 负 担 不 起 , 很 多 学 校 买 不 起 。 另 外 ，UNIX 系统 源码 不 开放 , 还 给 学 习 、 研 究 带 来 不 便 。UNIX 
厂商 间 恶 性 竞争 削弱 了 UNIX 系统 的 技术 优势 ,在 此 过 程 中 , 微软 公司 的 Windows 操作 系统 得 到 迅 
速 发 展 ， 占 据 桌面 领域 的 市 场 。 


1.1.2 Linux 概述 


为 方便 广大 师 生 学 习 、 研 究 UNIX 系统 ，1991 年 ， 芬 兰 的 林 纳 斯 。 托 瓦 效 (Linus Torvalds) 开 发 
了 一 套 多 用 户 、 多 任务 、 多 线程 的 类 UNIX 操作 系统 ， 即 Linux。Linux 继承 了 UNIX 系统 强大 的 功 
能 和 性 能 ， 采 用 与 UNIX 系统 兼容 的 操作 命令 ， 兼 容 UNIX 编程 接口 规范 POSIX。 学 会 操作 使 用 
Linux， 一 般 就 可 操作 UNIX 系统 ， 掌 握 了 Linux 环境 编程 ， 就 能 在 UNIX 环境 下 做 编程 开发 。 

Linux 系统 运行 于 廉价 的 PC 上 ， 免 费 使 用 ， 加 入 GNU 联盟 ， 开 放 源 码 ， 鼓 励 广 大 师 生 使 用 和 
开发 Linux 环境 的 配套 软件 ， 使 得 Linux 环境 的 各 种 开发 工具 (如 gcc) 和 应 用 软件 变 得 非常 齐全 ， 而 
且 全 部 开放 源码 、 免 费 使 用 、 免 费 升 级 。 

2001 年 ，Linux 2.4 版 本 内 核发 布 。2003 年 ，Linux 2.6 版 本 内 核发 布 ， 使 Linux 逐渐 成 为 一 种 
成 熟 的 操作 系统 ， 在 很 多 关键 领域 得 到 应 用 。 目 前 常见 的 Linux 内 核 版 本 有 Linux 2.4、Linux 2.6、 
Linux 3.2、Linux 4.6 等 。 

Linux 系统 自 1991 年 诞生 以 来 , 借助 mtemet， 通 过 全 世界 各 地 编程 爱好 者 的 共同 努力 ， 已 成 为 
今天 世界 上 使 用 最 多 的 一 种 类 UNIX 操作 系统 。Linux 可 安装 在 各 种 计算 机 硬件 设备 上 ， 比 如 个 人 
计算 机 、 大 型 机 、 超 级 计算 机 、Android 手机 、 平 板 电脑 、 路 由 器 ， 世 界 上 运算 最 快 的 10 台 超级 计 
算 机 全 部 运行 Linux 操作 系统 。 目 前 主流 大 数据 平台 Hadoop 的 每 个 节点 都 是 一 个 Linux 系统 。 

Linux 系统 开源 、 完 全 免费 、 安 全 性 好 、 可 靠 性 高 、 支 持 多 种 平台 ; 它 功能 强大 ， 目 录 结 构 、 
基本 命令 与 UNIX 一 致 ， 可 为 未 来 学 习 UNIX 系统 打下 很 好 的 基础 。 不 同 厂商 将 Linux 内 核 与 外 围 
实用 程序 和 文档 包装 ， 提 供 安装 界面 和 系统 配置 、 管 理工 具 等 ， 形 成 发 行 系统 ， 目 前 主要 发 行 版 本 
有 : Red Hat Enterprise、Fedora、Ubuntu 等 。 不 同 Linux 发 行 版 本 都 采用 至 今 仍 由 Linux 系统 创始 人 
林 纳 斯 。 托 瓦 兹 维护 的 同一 个 内 核 版 本 ， 在 某 种 发 行 版 本 下 编写 的 源 程 序 和 可 执行 程序 不 加 修改 即 
可 在 另 一 种 Linux 发 行 版 本 下 运行 ， 完 全 克服 了 UNIX 不 同 发 行 版 本 间 的 不 兼容 问题 。 
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哆 思考 与 练习 题 1.1 UNIX 系 统 得 以 发 展 的 主要 原因 是 什么 ? 进入 20 世 纪 90 年 代 和 21 世纪 后 ， 
阻碍 UNIX 进一步 发 展 的 原因 又 是 什么 ? 
二 思考 与 练习 题 1.2 近年 来 ，Linux 系统 从 诞生 到 得 以 广泛 应 用 的 原因 又 是 什么 ? 


Linux 系统 目录 结构 


图 1-1 是 Linux 系统 目录 结构 ， 它 与 UNIX( 如 IBM AIX、Sun Solaris) 系 统 具 有 大 体 一 致 的 目录 
结构 。 与 Windows 系统 不 同 ，Linux 系统 目录 结构 是 一 棵 树 ， 树 根 是 /， 每 个 文件 和 目录 的 路 径 都 是 
以 “/” 开 始 的 一 条 路 径 ， 如 /home/can。Linux 系统 没有 盘 符 概念 ， 除 根 分 区 外 ， 其 他 硬盘 分 区 的 文 
件 系统 都 挂 载 到 某 个 路 径 以 “/” 开 始 的 目录 下 。 其 中 主要 目录 路 径 、 功 能 ， 以 及 Windows 环境 下 
的 对 等 目录 或 设施 如 表 1-1 所 示 。 


根 目录 
bin 和 用 妇 闻 
ea Fw 


ysconfig ) 系统 也 办 


大 56od 系统 引文 件 


Cdev 设备 文件 EX X11 配 置 

统 程序 及 
ED Con rors ris 
Chome 用 户 日 杂 (bin 条 用 用 户 程 订 


include ) ccr+ 文 件 


全 应 用 程序 举 文件 
人 mn 区 认 分 区 挂 加 点 日 录 6cal 风 用户 自 行 安装 的 程序 


ib 条 二 程序 运行 库 


C66 第 三 方 软件 安装 日 录 365in 时 党 用 系统 管理 程序 
hare 时 共享 的 文档 及 文件 


Proc 系统 状态 文 - 
Ce 不 全 状 志文 件 全 代码 、 内 校 代码 日 录 


作风 oo 户主 日 了 TR Ren 
全 东 统 管理 及 序 cache 国 点 用 县 序 产生 的 组 存 文件 
有 人 时 文 件 存放 目录 全 lib 交点 用 程序 产生 的 数据 文件 
M169 系统 及 程序 日 志文 件 
erg 
Tin 应 用 程序 的 进程 PID 文 件 
Va us Ha C55 文件 级 冲 池 


Www 四 Web 号 务 默认 网 页 存放 日 录 
图 1-1 Linux 系统 目录 结构 


Linux/UNIX 采用 以 上 目录 结构 规范 的 好 处 有 : 

(1) 用 户 创建 的 文件 全 部 放 在 /home 目录 下 , 一 来 便于 实施 用 户 权 限 管理 ,二 来 可 创建 一 个 专门 
用 于 保存 用 户 文件 的 分 区 ， 挂 载 到 /home 目录 下 ， 方 便 管 理 ; 

(2) 可 创建 专用 系统 分 区 ， 保 存 Linux 系统 文件 ， 以 只 读 方 式 挂 载 在 /usr 目录 下 ， 防 止 恶意 用 户 
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或 病毒 破坏 系统 目录 ， 提 高 系统 安全 性 ; 


(3) 可 创建 一 个 专用 分 区 , 保存 动态 增长 的 文件 ， 以 读 写 方式 挂 载 到 /var 目录 下 ， 万 一 该 分 区 受 


到 破坏 ， 整 个 系统 不 受 影响 ， 提 高 系统 可 靠 性 ; 


(4) 这 种 目录 结构 规范 来 自 于 UNIX 系统 ， 所 有 的 UNIX 和 Linux 目录 结构 与 上 述 规范 大 体 相 


似 ， 使 UNIX/Linux 系统 具有 很 好 的 向 前 兼容 性 ， 同 时 也 方便 人 们 的 学 习 。 


表 1-1 Linux 目录 结构 说 明 


Windows 系统 
对 应 目录 
根 目录 , 所 有 的 目录 、 文件 、 设 备 都 在 根 目录 /下 , 根 目录 /就 是 Linux 
文件 系统 的 组 织 者 ， 也 是 顶级 目录 
bin 就 是 单词 binary 的 英文 缩写 ,含义 是 二 进 制 。 在 一 般 的 系统 中 ， CAWINDOWS\ 
可 以 在 这 个 目录 下 找到 Linux 常用 的 用 户 命令 system32 
Linux 内 核 及 系统 引导 过 程 所 需 的 文件 所 在 目录 , 比如 vmlinuz initd img 
文件 就 位 于 这 个 目录 中 。 一 般 情况 下 ，GRUB 或 LILO 系统 引导 管 
理 器 也 位 于 这 个 目录 中 
dev 是 单词 device 的 英文 缩写 ， 这 个 目录 中 包含 Linux 系统 中 使 用 的 
所 有 设备 文件 ， 是 访问 这 些 外 部 设备 的 一 个 入 口 ， 使 用 户 能 够 用 操 
作文 件 的 方法 操作 这 些 外 部 设备 
目录 /ete 中 存放 各 种 系统 配置 文件 , 其 中 还 有 子 目 录 、 系统 网 络 配 置 注册 表 


文件 、 文 件 系统 、X 图 形 界面 配置 、 设 备 配置 、 用 户 设置 信息 等 都 
在 这 个 目录 中 

普通 用 户 的 家 目录 , 如 果 建立 一 个 用 户 , 用 户 名 是 "xx", 那么 在 /home 
目录 下 就 有 一 条 对 应 的 /home/xx 路 径 ， 它 是 用 来 存放 用 户 文件 的 主 
目录 

CC++ 源 程序 所 需 的 系统 头 文件 默认 所 在 的 目录 


地 是 library 的 缩写 。 这 个 目录 用 来 存放 系统 的 库 文件 。 几 乎 所 有 的 
应 用 程序 都 会 用 到 这 个 目录 中 的 库 文件 


Ci\Documents and 


Settings 


C\WINDOWS\ 
System32 


在 ext2 或 ext3 文件 系统 中 , 当 系统 意外 崩溃 或 机 器 意外 关机 而 产生 
一 些 文件 碎片 时 ， 将 它们 放 在 这 里 


这 个 目录 一 般 用 于 管理 存储 设备 的 挂 载 目录 , 比如 /mnt/cdrom 子 目录 
下 挂 载 cdrom、/mnt/C 下 挂 载 WindowsC 盘 
这 里 主要 存放 那些 可 选 的 程序 


可 以 在 这 个 目录 下 获取 系统 及 各 种 进程 信息 ， 这 些 信息 在 内 存 中 ， 
由 系统 自己 产生 


注册 表 


Linux 超级 权限 用 户 root 的 家 目录 
这 个 目录 用 来 存放 系统 管理 用 的 命令 与 程序 ， 执 行 其 中 的 命令 时 需 
要 具备 超级 权限 用 户 root 的 权限 
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( 续 表 ) 
Windows 系统 
目录 描述 对 应 目 杂 
/selinux 对 SELinux 的 一 些 配置 文件 目录 ，SELinux 可 以 让 Linux 更 加 安全 
/srv 服务 启动 后 所 需 访问 的 数据 目录 ， 如 www 服务 启动 后 ， 读 取 的 网 
页 数据 就 可 以 放 在 /srviwww 中 
/tmp 临时 文件 目录 ， 用 来 存放 不 同 程序 执行 时 产生 的 临时 文件 。 有 些 用 CiWindows\Temp 
户 程序 在 运行 过 程 中 会 产生 临时 文件 
/sr 这 是 系统 存放 程序 的 目录 , 比如 命令 、 帮 助 文件 等 , 当 我 们 安装 Linux Ci\Program Files 
发 行 版 官方 提供 的 软件 包 时 ， 大 多 安装 在 这 里 
Jar 这 个 目录 中 的 内 容 经 常 变动 ， 其 名 字 为 单词 variable 的 缩写 , /var 下 
的 子 目 录 /varlog 用 来 存放 系统 日 志 ; /warwww 子 目录 用 于 存放 
Apache 服 务 器 网 站 的 文件 ，/var/lib 子 目 录用 来 存放 一 些 库 文件 ， 比 
如 MySQL 的 库 文 件 以 及 MySQL 数 据 库 


末 ”” 思考 与 练习 题 1.3 ”Linux 目录 结构 有 何 意义 ? /home、/usr、/etc、/var 等 目录 的 用 途 是 什么 , 这 
样 安排 有 何 好 处 ? 

续 思考 与 练习 题 1.4。” 简 述 /etc、/home/guest、/root、/var、/usr、/usr/llib、/bin、/tmp、/usr/include、 
/usr/sbin、/boot 等 目录 保存 何 种 用 途 的 文件 。 


Linux 系统 的 安装 、 启 动 、 登 录 、 用 户 界面 与 命令 格式 


1.3.1 在 VMware 中 用 快照 快速 安装 Linux 虚拟 机 系统 


假设 安装 于 DD 盘 ， 有 具体 步骤 如 下 : 

(1) 下 载 VMWare; 

(2) 安装 VMware( 安 装 过 程 中 需要 重启 计算 机 ); 

(3) 下 载 Ubuntu 快照 并 解压 缩 到 DD 盘 ， 目 录 名 为 Dubuntu; 

(4) 启动 VMware， 输 入 序列 号 ; 

(5) 选择 FileOpen， 选 择 打 开 D:wbuntu 下 的 :vmx 文件 ， 双 击 My Computer 下 的 Linux 或 
Ubuntu， 启 动 Ubuntu Linux; 

(6) 选择 VM 一 >*Update VMWare Tools Installation， 更 新 VMWare 工具 ， 安 装 可 在 主机 与 Linux 
虚拟 机 之 间 以 拖 放 方式 复制 文件 的 功能 。 


1.3.2 ”启动 与 登录 Linux 
1. 启动 与 登录 系统 


观看 “Linux 系统 启动 与 登录 (以 普通 用 户 身份 登录 ).exe” 视 频 。 与 Windows 系统 一 样 ， 为 安全 
起 见 ，Linux 系统 启动 后 ， 提 示 用 户 输入 用 户 名 与 密码 以 完成 登录 ， 才 能 使 用 系统 执行 任务 。Linux 
系统 有 两 类 用 户 : 普通 用 户 与 超级 用 户 (管理 用 户 )。 超级 用 户 为 root， 在 系统 安装 过 程 中 创建 ， 可 执 
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行 系统 管理 、 维 护 、 软 件 安装 等 工作 ， 具 有 执行 任何 操作 的 权限 ， 相 当 于 Windows 下 的 管理 用 户 
Administrator。 超 级 用 户 root 的 家 目录 为 /root。 

在 实验 中 启动 VMWare 后 ， 选 择 Ubuntu 并 启动 Linux 系统 后 ， 以 普通 用 户 can 的 身份 登录 ， 
输入 密码 123456 后 进入 系统 。 打 开 命令 窗口 ， 可 输入 用 户 命令 ， 命 令 提 示 符 为 “$”， 视 频 中 还 演 
示 了 创建 hello.c 文件 的 过 程 。 

当然 也 可 以 root 用 户 身份 登录 , 打开 终端 窗口 , 可 执行 任何 操作 , root 用 户 的 密码 也 是 123456， 
为 了 能 够 与 普通 用 户 的 操作 环境 有 明显 区 别 ，root 用 户 的 命令 提示 符 是 “#”。 

2. 如 何 切换 成 root 用 户 身份 


在 普通 用 户 打开 的 以 “$” 为 提示 符 的 终端 窗口 中 ， 输 入 命令 “su -”， 接 着 输入 root 用 户 的 
密码 ， 就 可 以 暂时 切换 成 root 用 户 身份 ， 命 令 提示 符 变 成 “#”， 之 后 就 可 执行 需要 root 用 户 权限 
的 各 种 操作 和 命令 了 。 执 行 完 需要 root 用 户 权限 的 操作 后 ， 可 执行 “exit” 命 令 ， 退 出 root 登录 身 
份 ， 恢 复 成 原来 的 普通 用 户 身份 。 


3. Linux 系统 的 一 般 操 作 方式 


一 般 以 普通 用 户 身份 登录 Linux 系统 ， 通 过 在 终端 窗口 中 输入 操作 命令 来 使 用 系统 。Linux 系 
统 提倡 使 用 终端 命令 来 执行 各 种 操作 的 原因 是 ，Linux 操作 命令 的 种 类 异常 丰富 ， 功 能 强大 ， 如 果 
设计 成 由 桌面 系统 启动 ， 反 而 过 于 复杂 ， 操 作 不 便 。 

以 普通 用 户 身份 登录 的 原因 是 ， 普 通用 户 的 操作 权限 受 限 ， 凡 涉及 系统 配置 、 管 理 、 维 护 的 命 
令 都 无 权 执行 ，Linux 系统 遭受 攻击 的 威胁 较 小 ， 系 统 安全 性 和 可 靠 性 较 高 。 例 如 ， 当 普通 用 户 因 
误 操作 执行 硬盘 格式 化 或 对 系统 文件 执行 删除 操作 时 ， 系 统 将 拒绝 执行 ， 可 避免 不 必要 的 损失 ;又 
如 ， 当 普通 用 户 意外 双击 执行 病毒 或 木马 程序 时 ， 病 毒 或 木马 程序 的 影响 仅 限于 该 用 户 的 文件 ， 而 
不 至 于 危及 整个 系统 的 安全 。 


1.3.3 三 种 系统 操作 界面 
Linux 提供 了 三 种 方法 ， 以 方便 用 户 操作 和 使 用 Linux 系统 。 
1. 图 形 界面 
一 般 启动 Linux 系统 后 直接 进入 图 形 用 户 界面 ， 通 过 选择 主 菜单 或 单 击 文件 管理 器 ， 可 执行 系 


统管 理 和 文件 操作 ,图 1-2 是 Ubuntu 下 的 文件 管理 器 界面 ， 可 通过 下 拉 菜 单 、 弹 出 菜单 等 方法 执行 
文件 、 目 录 操 作 。 

2. 命令 界面 

由 于 Linux 系统 的 功能 非常 强大 ， 系 统 操 作 种 类 异常 丰富 ， 而 桌面 环境 通常 难以 支持 太 多 操作 
功能 ， 因 此 Linux 的 多 数 功能 难以 通过 图 形 界面 运行 。 为 此 ，Linux 系统 提供 了 大 量 的 操作 命令 ， 
通过 终端 窗口 或 命令 窗口 ， 输 入 命令 来 操作 Linux 系统 ， 命 令 输 出 也 显示 在 终端 窗口 中 。 命 令 界面 
还 有 一 个 好 处 ,在 未 启动 图 形 界面 的 系统 中 ， 也 可 方便 地 操作 Linux 系统 。 对 计算 机 专业 人 员 来 说 ， 
往往 更 多 地 使 用 命令 界面 进行 各 种 开发 工作 ， 因 为 这 样 效率 更 高 。 在 图 1-3 中 ， 输 入 命令 8 可 显示 
当前 目录 下 的 文件 列表 ， 而 输入 cat /etc/passwd 则 显示 用 户 数据 库 文件 /etc/passwd 的 内 容 。 
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图 1-2 ”Ubuntu Linux 文件 管理 器 
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图 1-3 ”Linux 命令 界面 


3. 编程 接口 


编程 接口 是 指 在 C/C++ 语言 程序 (也 包括 其 他 程序 ) 中 调用 Linux 系统 功能 的 方法 ， 一 般 是 通过 
一 些 称 为 系统 调用 的 库 函 数 来 实现 的 。 例如 : 文件 操作 流 接口 一 fopen、 fread、 fwrite、 felose、 fseek， 
在 程序 中 调用 这 些 函 数 可 打开 、 读 、 写 、 关 闭 文件 ， 以 及 移动 读 写 指针 ; 文件 与 设备 操作 系统 调用 
接口 一 open、read、write、close， 在 程序 中 调用 这 些 函 数 可 打开 、 读 、 写 、 关 闭 文件 或 设备 。 本 
书后 面 各 章 主要 讨论 如 何 使 用 Linux 库 函 数 来 进行 Linux 系统 编程 。 
1.3.4 Linux 命令 格式 和 说 明 

1. Linux 命令 格式 

Linux 系统 命令 遵循 一 种 统一 的 格式 ， 一 般 形 式 为 : 

$ 命令 名 选项 参数 1 参数 2 .… 

命令 名 、 选 项 、 参 数 间 以 空格 分 隔 ， 在 很 多 命令 中 ， 选 项 与 参数 都 有 默认 值 ， 各 部 分 说 明 如 下 : 

(1) 命令 名 


一 般 是 由 小 写 英文 字母 构成 的 字符 串 ， 往 往 是 表示 相应 功能 的 英文 单词 的 缩写 。 例 如 ，date 表 
示 日 期 ，who 表示 谁 在 系统 中 ; cp 是 copy 的 缩写 ， 表 示 拷 贝 文件 等 。Linux 系统 支持 的 用 户 命令 主 
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要 放 在 目录 /usrbin 和 /bin 下 。 命 令 名 中 出 现 大 写字 母 的 命令 一 般 都 不 是 正确 的 系统 命令 。 

(2) 选项 

选项 是 对 命令 的 特别 定义 ， 以 “-” 开 始 ， 指 示 命 令 按 特 定 模式 执行 ， 生 成 输出 。 例 如 : 加 -1 选 
项 的 ks 命令 “xz -1” 表 示 以 长 格式 显示 文件 列表 ， 每 个 文件 一 行 ， 显 示 文件 名 与 属性 ， 加 选项 -a 的 
ls 命令 “1s -a” 表 示 文 件 名 以 点 (.) 开 头 的 隐藏 文件 也 要 显示 出 来 ， 若 同时 使 用 多 个 选项 ， 多 个 选项 
可 共用 一 个 “-” 连 起 来 ，“1s -1-a” 命 令 与 “1s -ia” 命 令 的 功能 完全 相同 ， 显 示 包 括 隐藏 文件 的 当 
前 目录 文件 属性 。 

不 同 选项 的 书写 一 般 没 有 先后 限制 ， 但 如 果 选 项 本 身 带 有 参数 ， 那 么 选项 和 参数 必须 在 一 起 ， 
中 间 不 允许 插入 其 他 命令 参数 或 命令 选项 。Linux 命令 的 选项 一 般 位 于 命令 参数 之 前 ， 有 时 也 放 在 
命令 参数 之 后 。 例 如 ， 按 长 格式 显示 包括 隐藏 文件 在 内 的 文件 目录 列表 的 命令 “1s -1 -a” 也 可 写成 
“1s -a -1”。 在 将 C 程序 hello.c 编译 成 可 执行 程序 hello 的 命令 “gcc -o hello hello.c” 中 ， 命 令 选 项 
“-o hello” 用 于 指定 输出 文件 名 ， 命 令 参 数 是 源 程序 文件 名 “hello.c”， 人 允许 二 者 交换 ， 将 命令 写成 
“gcc hello.c -o hello”， 但 不 能 写成 “gcc -o hello.c hello”， 因 为 命令 选项 名 “-o” 与 其 参数 “hello” 
被 命令 参数 hello.c 隔 开 了 。 

(3) 参数 

提供 命令 运行 的 信息 或 是 命令 执行 过 程 中 使 用 的 文件 名 。 通 常 参数 是 一 些 文件 名 ， 告 诉 命令 从 
哪里 可 以 得 到 输入 , 以 及 把 输出 送 到 什么 地 方 , 例如 命令 “cp file1l file2” 将 文件 filel 复制 到 文件 file2。 
更 思考 与 练习 题 1.5 ”指出 命令 “ls -1 -a /home/can” 与 “gcc -0 he he.c” 中 ， 哪 个 是 命令 名 、 
选项 与 参数 ， 它 们 的 含义 是 什么 ? 


2. 命令 说 明 


(1) 判断 命令 执行 是 否 成 功 
一 条 Linux 命令 仅 在 命令 名 、 选 项 、 参 数 全 部 正确 时 ， 才 能 正确 执行 ， 否 则 执行 将 失败 ， 并 显 
示 出 错 信息 ， 出 错 信息 的 格式 为 “命令 名 : 出 错 描述 ”。 以 下 是 命令 执行 失败 的 示例 : 


SLS # 命 令 名 错误 ， 显 示 目 录 列 表 的 命令 是 小 写字 符 串 ls 
bash: LS: command not found 。 # 显 示 命令 LS 未 找到 错误 

Sl -Pp # 命 令 ls 无 选项 P 

1s: invalid option —P 

Sl - PP # 文 件 PP 不 存在 

1s: cannot access PP: No such file or directory 

(2) 命令 输出 


如 果 命令 执行 后 有 输出 ， 成 功 执 行 后 的 输出 信息 紧 接着 命令 串 显示 。 由 于 很 多 Linux 命令 没有 
输出 ， 如 下 面 将 要 介绍 的 目录 与 文件 操作 命令 cd、mkdir、mmdir、mm、mv， 它 们 执行 完毕 后 ， 将 立 
即 显示 命令 提示 符 “$” 或 “#”。 由 于 含有 错误 的 命令 一 定 会 显示 出 错 信 息 ， 因 此 一 条 命令 如 果 执 
行 后 没有 任何 输出 而 立即 显示 命令 提示 符 ， 则 说 明 该 命令 的 执行 一 定 是 成 功 的 。 例 如 : 

Sed # 该 命令 无 任何 输出 ， 执 行 必然 成 功 

$ 

G) 联机 帮助 

Linux 操作 系统 的 联机 帮助 对 每 个 命令 (包括 主要 系统 配置 文件 ) 的 准确 语法 都 做 了 说 明 , 可 以 使 
用 man、info 等 命令 来 获取 相应 命令 的 联机 说 明 ， 如 “man ls” 和 “info ls”。man 和 info 命令 一 般 
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按 字符 q 即 可 退出 。 
和 思考 与 练习 题 1.6 ”查找 帮助 ， 了 解 wc 命令 的 功能 和 用 途 。 
思考 与 练习 题 1.7 查找 联机 帮助 ， 请 给 出 文件 /etc/fstab、 命 令 pwd 的 用 途 。 

(4) 本 书 命令 输入 说 明 

若 命令 提示 符 为 “#”， 则 假定 是 以 管理 用 户 root 身份 登录 ; 若 命令 提示 符 为 “$”， 则 假定 是 
以 普通 用 户 can 身份 登录 。 为 方便 读者 练习 ， 书 中 的 用 户 输入 命令 和 信息 以 斜体 文本 行 显示 ， 系 统 
显示 内 容 以 常规 字体 文本 行 显示 ,用 户 输入 命令 行 后 面 以 “# ”开头 的 文字 是 对 命令 功能 的 解释 ， 如 


图 1-4 所 示 。 
#3R$: 斜体 部 分 : # 开 始 部 分 
命令 提示 符 命令 串 命令 说 明 
Spwd # 显 示 当前 目录 路 径 
/home 


命令 输出 
1-4 ”本 书 命令 输入 说 明 


Linux 文件 、 目 录 操 作 及 文件 属性 、 权 限 


通常 ， 普 通用 户 的 主要 工作 一 般 是 处 理 文件 档案 ， 通 过 命令 从 文件 中 读 取 输入 数据 ， 处 理 后 ， 
保存 到 另 一 文件 。Linux 系统 为 每 个 普通 用 户 在 /home 目录 下 创建 了 一 个 以 用 户 名 命名 的 “家 ”目录 ， 
如 用 户 can 的 “家 ”目录 是 /home/can, 用 户 guest 的 “家 ”目录 是 /home/guest, 但 根 用 户 root 的 “家 ” 
目录 是 /root。 按 照 Linux 系统 权限 管理 规范 ， 普 通用 户 仅 能 在 其 “家 ”目录 (用 户主 目录 ) 下 创建 、 修 
改 、 删 除 文件 ， 而 不 能 增删 “家 ”目录 之 外 其 他 目录 中 的 文件 ， 从 而 使 系统 有 较 好 的 文件 保护 能 力 。 
与 文件 操作 相关 的 Linux 命令 主要 包括 : 文件 与 目录 操作 命令 、 文 件 内 容 查阅 命令 、 文 件 目录 权限 
设置 命令 、 文 件 搜寻 命令 等 。 


1.4.1 目录 路 径 与 目录 操作 


1. 绝对 路 径 、 工 作 目 录 和 相对 路 径 


Linux 里 面 的 目录 是 “ 树 状 结构 ”， 一般 每 个 叶子 节点 为 一 个 普通 文件 ， 每 个 分 支 节点 为 一 个 目 
录 文 件 。 要 操作 或 访问 某 个 文件 ， 应 通过 路 径 方 式 给 出 文件 所 在 位 置 。 

@ 绝对 路 径 : 要 对 某 个 文件 (或 目录 ) 进 行 操 作 ， 可 在 命令 中 给 出 从 根 目录 开始 ， 直 到 所 要 操作 
文件 名 、 中 间 以 “/” 隔 开 的 完整 路 径 ， 称 为 绝对 路 径 ， 如 显示 文件 内 容 命令 cat /etcpasswd 
和 more /Nome/can/NachOS-4.1/code/tesy/。Linux 系统 中 文件 路 径 的 目录 分 隔 符 是 “/” 而 不 
是 “”， 这 是 与 Windows 系统 另 一 个 不 同 的 地 方 。 

@ 工作 目录 : 为 缩短 文件 路 径 字 符 串 长 度 ，Linux 系统 为 每 个 命令 窗口 (Terminal, 终端 ) 和 应 用 
进程 设置 了 一 个 工作 目录 (初始 设置 为 用 户 的 “家 ”， 可 用 命令 cd 改变 )， 当 用 户 操 作 工 作 
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目录 中 的 文件 时 ， 仅 需要 在 命令 中 给 出 文件 名 ， 不 需要 给 出 完整 路 径 ， 以 简化 命令 输入 。 
若 当前 工作 目录 为 “home/can”， 要 在 该 目录 下 创建 新 文件 生 ， 只 需要 执行 命令 touch f1。 

e@ ”相对 路 径 : 从 绝对 路 径 中 删除 工作 目录 部 分 后 得 到 的 路 径 为 相对 路 径 。 若 当前 工作 目录 为 
“/home/can ”， 则 文件 /home/can/NachOS-4.1/code/testladdc 可 用 相对 路 径 表示 为 
NachOS-4.1/code/test/add.c, 相应 的 文件 内 容 显示 命令 也 简化 为 cat NachOS-4.1/code/tesVadd.c。 


2 几 个 特殊 目录 名 (“” “ ” “” “" ) 


Linux 系统 定义 了 几 个 符号 来 表示 一 些 常用 的 特殊 目录 ， 给 命令 输入 带 来 方便 : 

e “.” 代 表 当 前 工作 目录 , 若 工 作 目 录 为 /home/can， 则 在 文件 路 径 中 ,，“.” 等 同 于 /home/can， 
每 个 目录 下 都 有 一 个 文件 名 为 “.” 的 目录 ; 

e “..” 代 表 上 一 层 目录 ， 若 当前 目录 为 home/can， 则 “..” 表示 目录 /home， 每 个 目录 下 也 
有 一 个 文件 名 为 “..” 的 目录 ; 

。 “-” 代 表 前 一 个 工作 目录 ， 若 当前 工作 目录 为 /home/can， 则 执行 cd /ete 命令 后 ，“.” 表 示 


/etc， 而 “-” 


表示 /home/can; 


e “~” 代 表 当 前 用 户 所 在 的 家 目录 , 若 当前 用 户 为 can, 则 其 家 目录 /home/can 可 表示 为 “~”; 
非 当前 用 户 guest 的 家 目录 则 表示 为 ~guest。 
叮 ” 思考 与 练习 题 1.8 用 1s -a 命令 显示 目录 列表 , 可 以 看 到 每 个 目录 下 都 有 文件 名 为 “.” 和 “..” 
的 两 个 目录 文件 ， 这 是 为 什么 ? 
ee 思考 与 练习 题 1.9 ”当前 用 户 为 can, 当前 工作 目录 为 /home/can/work 时 ,文件 /home/can/work/ 
lib/wrapper.h 的 相对 路 径 是 什么 ?文件 ~/a.out 的 绝对 路 径 是 什么 ? 


3. Linux 目录 操作 命令 (cd、pwd、mkdir、rmdir、rm) 


Linux 下 文件 目录 的 操作 包括 创建 目录 、 删 除 目录 、 切 换 工 作 目 录 、 显 示 当 前 工作 目录 路 径 等 。 

(1) cd( 变 换 工作 目录 )、pwd( 显 示 当 前 工作 目录 ) 

Linux 系统 使 用 cd(change directory) 命 令 改 变 当前 工作 目录 ， 使 用 pwd(print work directory) 命 令 
显示 当前 工作 目录 的 绝对 路 径 。 通 常人 们 喜欢 将 这 两 个 命令 联合 使 用 ， 用 cd 命令 切换 到 目标 目录 ， 
用 pwd 命令 验证 切换 到 哪里 了 。 这 两 个 命令 的 格式 为 : 


$cd 月 如 名 

Sed 

Spwd 

以 下 是 使 用 范例 : 

Spwa # 假 设 当前 登录 用 户 为 can， 其 “家 ”目录 为 最 初 的 当前 工作 目录 
/home/can 

Sed ~guest # 将 当前 工作 目录 切换 到 用 户 guest 的 家 目录 /home/guest， 没 有 报告 出 错 信息 

# 立 即 出 现 命令 提示 符 ， 未 显示 任何 出 错 信息 ， 表 明 命令 执行 是 成 功 的 

Spwa # 显 示 当 前 工作 目录 ， 表 明确 实 切 换 到 用 户 can 的 家 目录 /home/can 
/home/guest 

Scd ~ # 表 示 回 到 用 户 can 的 家 目录 /home/can 

Spwa # 显 示 当 前 工作 目录 ， 结 果 为 home/can， 表 明确 实 切换 到 了 家 目录 

/home/can 

Scd #d 命令 不 带 任何 参数 和 命令 选项 ， 表 示 回 到 自己 的 家 目录 /home/can 
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[全 # 表 示 切 换 到 上 级 目录 ， 即 /home/can 的 上 层 目录 /home 

Spwad # 显 示 当 前 目录 路 径 ， 结 果 是 “/home”， 表 明确 实 进入 到 希望 的 目录 
/home 

Scd - # 和 表示 回 到 前 一 条 cd 命令 执行 前 的 目录 ， 即 /home/can 


# 读 者 随后 可 用 命令 pwd 测试 cd -是 否 执行 成 功 
Scd har/spooVmail # 用 绝对 路 径直 接 转 到 目录 /var'spoolmail 
$cd ./mqueue # 用 相对 路 径 转 到 目录 /var/spoolmqueue 
比 思考 与 练习 题 1.10 ”假设 当前 登录 用 户 是 root, 不 执行 命令 , 分 析 下 列 两 个 命令 序列 中 pwd 
命令 的 输出 。 


命令 序列 1: 命令 序列 2: 
#cd ~ Fe 

# .pwd #pwad 

#cd ~can #cd - 

#pwad #pwad 


(2) mkdir( 创 建 目录 )、rmmdir( 删 除 空 目录 )、ls( 检 视 目 录 )、rmm( 删 除非 空 目 录 ) 

Linux 提供 的 mkdir(make directory)、rmdir(remove directory) 两 个 命令 分 别 用 于 创建 新 的 目录 、 
删除 空 目录 , 但 删除 非 空 目录 要 用 rm(remove) 命 令 。 通常 会 在 某 个 mkdir、 rmdir、 mm 命令 后 跟 ls(lis) 
命令 ， 列 出 文件 目录 ， 以 验证 目录 创建 、 目 录 删 除 操作 是 否 成 功 。 

$ mkdir 情爱 台 /创建 目录 

$ls 月 如 名 // 显 示 目 录 列 表 


S$ rmdir 人 月 如 名 // 删 除 空 目录 
Srm - 太 月 如 名 // 删 除 任何 目录 ， 选 项 - 玫 表 示 强 制 删 除 子 目 录 在 内 的 文件 


以 下 是 使 用 范例 (假设 先 以 can 用 户 身份 登录 并 打开 终端 窗口 ): 


Scd /mp 孝 tmp 是 可 读 写 公共 临时 目录 ， 到 这 里 去 工作 

Spwd # 显 示 当 前 工作 目录 ， 为 /tmp 

/tmp 

Srm -tf * 者 除 当前 目录 下 的 所 有 文件 与 目录 ， 清 空 ， 一 般 慎 用 
Sls # 显 示 当 前 目录 列表 ， 已 经 为 空 

Smkdir test # 在 当前 目录 /tmp 下 建立 名 为 test 的 新 目录 

Sls # 用 s 测试 执行 情况 ， 看 到 了 test 目录 名 ， 创 建成 功 
test 


$mkdir test1 tesVsub test2 # 他 建 test1、test/sub、test2 三 个 目录 

Sls . fest # 列 出 当前 工作 目录 和 test 目录 列表 ， 看 到 三 个 新 创建 的 目录 
test testl test2 

test: 

sub 

Srmdir test1 放出 | 除 空 目录 test1， 成 功 

Srmdir iesf # 试 图 删除 非 空 目录 test， 报 告 失败 及 出 错 原因 

Tmdir: failed to remove 'test1': Directory not empty 

Srm -1 fest  # 改 用 带 f 选 项 的 mm 命令 删除 非 空 目录 test， 执 行 成 功 


Sls # 再 检视 目录 内 容 
test2 # 仅 剩 目录 test2，test 与 testl 都 被 删除 
(3) ls( 文 件 目录 检视 命令 ) 


ls 命令 用 于 检视 指定 目录 下 的 文件 列表 与 文件 属性 ， 应 用 十 分 广泛 ， 常 用 格式 为 : 
SN [a4df/FhilRS] 局 有 灵台 


其 中 方 括号 0] 表示 其 中 的 命令 选项 可 有 可 无 ， 对 常用 命令 选项 的 说 明 如 下 。 

。 -o: 列 出 全 部 文件 (或 称 档案 )， 连 同文 件 名 以 “.” 开 头 的 隐藏 文件 。 

。 -4: 列 出 全 部 文件 ,连同 隐藏 文件 (但 不 包括 “.” 与 “..” 这 两 个 目录 )， 这 个 选项 用 得 较 多 。 

。 -F， 根据 文件 、 目 录 等 信息 类 型 ， 给 出 类 型 标记 符号 。 例 如 : 
* 代 表 可 执行 文档 /代表 目录 = 代表 socket 文件 :| 代表 FIFO 文件 无 标记 符号 者 为 普通 
无 执行 权限 文件 。 

e。 -5 列 出 索引 节点 (inode) 编 号 。 

e -1: 以 长 格式 列 出 目录 内 容 ， 包 含 大 多 数 文件 属性 ， 这 个 选项 用 得 较 多 。 

。 -R: 连同 子 目录 内 容 一 起 列 出 。 

以 下 是 一 些 命令 执行 范例 ( 先 以 root 用 户 身份 登录 并 打开 终端 窗口 ): 

Scd # 回 到 用 户 can 的 “家 ”目录 


Eg # 显 示 当前 目录 文件 列表 
Desktop Nachos-3.4-for-ubuntu.tar.gz Public 


Sls -4 # 显 示 当前 目录 列表 ， 包 括 文件 名 以 “.” 开 头 的 隐藏 文件 
# 文 件 名 以 “.” 开 头 的 隐藏 文件 ， 在 文件 管理 器 中 
# 以 及 使 用 不 带 -A 和 -a 选项 的 命令 时 都 不 会 显示 
:bash history .lesshst Pictures 


Sk /ete #4 给 出 绝对 路 径 ， 列 出 目录 /ete 下 的 文件 名 列表 


Ss -F # 列 出 当前 目录 列表 ， 给 出 每 个 文件 的 类 型 标记 
Desktop/ nachos-3.4/ Pictures/ 

fifol| a.out* test fl 

Sk - ~ # 将 家 目录 (可 用 符号 ”~ ”表示 ) 下 


# 的 所 有 文件 及 详细 属性 列 出 来 ， 每 行 一 个 文件 
total 24708 
drwxr-XI-X 2 root root 4096 2012-08-21 17:31 Desktop 
drwxr-xrX 2 root root 4096 2012-08-18 23:27 Documents 
drwxr-XI-X 2 root root 4096 2012-08-18 23:27 Downloads 


-TW-I--T- 1 root root 02015-02-01 11:41 人 
PIW-I--I-- 1 root root 0 2015-02-01 11:38 fifol 
Sls -i # 显 示 当前 目录 (省 略 目录 名 为 当前 目录 ) 下 
# 所 有 文件 的 文件 名 及 其 i 节点 号 (显示 于 文件 名 的 前 面 ) 
686757 Desktop 686812 nachos-4.0.tar 


807026 Documents 807159 NachOS-4.1.bak 


Sls -it 
或 
Ss -i al # 显 示 当前 目录 下 的 所 有 文件 

堆 包 括 隐藏 文件 ) 的 i 节点 

# 节点 的 概念 在 下 面 进行 介绍 ) 

# 多 个 命令 选项 可 以 写 到 一 起 ， 也 可 分 开 写 
683678 -rw 1 root root 7428 2014-04-05 15:44 bash_history 
686917 -Iw-r-r— 1 rootroot 3135 2012-08-19 15:07 bashrc 
925835 drwx—-— 5 root root 4096 2015-02-01 08:07 .cache 
678320 drwx—-— 9 root oot 4096 2012-10-24 17:55 .config 
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如 思考 与 练习 题 1.11 使 用 ls 命令 查看 can 主 目录 下 有 哪些 隐藏 文件 ， 并 猜测 其 用 途 。 


1.4.2 文件 属性 与 权限 


1. 文件 属性 


前 面 的 二 命令 以 长 格式 显示 目录 下 或 符合 条 件 的 文件 列表 ， 每 行 显示 一 个 文件 的 属性 ， 每 个 


文件 或 目录 常用 的 属性 有 9 种 ， 如 下 所 示 : 


root@ubuntu:~# ls -ild coml fifol fl work 


1 root root 54,1 2015-02-01 12:11 coml 
1 root root 0 2015-02-01 11:41 fl 
1 root root 0 2015-02-0111:38 fifol 
4 root root 4096 2012-10-24 23:26 work 
链 所 所 一 文 最 
接 必 届 以 件 后 件 
有 月 下 才 大 修 
数 户 户 市 小 改 
组 计 
一 间 


其 中 ， 所 属 用 户 是 指 该 文件 归 哪个 用 户 拥有 ， 所 属 用 户 组 是 指 归 哪 个 用 户 组 拥有 。 文 件 大 小 以 
字 节 为 单位 ， 但 由 于 管道 ffol 的 数据 完全 存在 于 内 存 中 ， 不 占用 磁盘 空间 ， 其 文件 大 小 显示 为 0; 
字符 设备 文件 coml 也 不 是 真正 的 文件 ， 只 是 借用 文件 名 形式 来 表示 设备 ， 文 件 大 小 字段 中 的 第 1 
个 数 54 表示 设备 类 型 , 称 为 主 设备 号 , 文件 大 小 字段 中 的 第 2 个 数 1 表示 该 设备 在 同类 设备 中 的 编 


号 为 1。 文 件 属性 中 其 他 字段 的 含义 稍 后 介绍 。 


Linux 系统 在 文件 目录 列表 中 用 字符 -、d、c、b、p、! 分 别 表示 常规 文件 、 目 录 文 件 、 字 符 设备 
文件 、 块 设备 文件 、 管 道 文件 、 符 号 链接 文件 。Linux 文件 系统 中 用 16 位 二 进 制 数 对 文件 类 型 和 权 
限 进行 编码 ， 图 1-5 描述 了 Linux 文件 类 型 和 访问 权限 位 的 结构 (类 型 名 为 st_mode)。 其 中 ，12~15 


位 是 文件 类 型 的 编码 ， 符 号 S_IFxxx 是 表示 相应 文件 类 型 的 宏 ， 文 件 具 有 相应 的 类 型 ， 


其 宏 所 对 应 


的 位 为 1。 例 如 目录 文件 类 型 ，st_mode 的 位 14 为 1， 则 表示 这 种 文件 类 型 的 宏 的 八进制 数值 为 
S_IFDIR=0040 000; 而 对 于 符号 链接 类 型 ，st_mode 的 位 13、 位 15 为 1， 因 此 S_ IFLNK=0120 000。 


S_IFLNK  S_IFBNK 


S_IFSOCK 
pe 符号 链接 ” 块 设备 
套 接口 
竹 “5 14 13 和 下 0 二 省 让 5 
st_mode em 
hs 
te 
S_IFREG ISVIX 《We 上 二 a 
常规 
IRUSR IRGRP IROTH 
S_IFCHR ISUID 
符 设备 | (set_uid) IWUSR IWGRP IWoTH 
IXUSR IXGRP IXOTH 
SIFDIR sfFO ISGID IRWXU IRWXG IRWXO 


管道 


(set_gid) (文件 主 ) 


( 同 组 ) 


1-5 Linux 文件 类 型 和 访问 权限 位 的 结构 


(其 他 ) 


2. 文件 访问 权限 


Linux 对 每 一 个 文件 (包括 文件 目录 、 管 道 、 设 备 等 ) 都 设置 了 访问 权限 , 对 所 属 用户 ( 又 称 文件 主 ， 
owner)、 所 属 用 户 组 (group) 和 其 他 用 户 (othern)， 都 可 设置 读 (r, read))、 写 (w, write)、 执 行 (x, execute) 
三 种 访问 权限 。 

st_mode 用 0~11 位 表示 文件 访问 权限 ， 其 中 位 6~8 分 别 对 应 文件 主 的 执行 (x)、 写 (w)、 读 @) 权 
限 ， 当 owner 拥有 某 种 权限 时 ， 对 应 位 为 1， 和 否则 为 0。 位 3~5 为 所 属 用 户 组 访问 权限 ， 位 0-2 为 
其 他 用 户 访问 权限 。 当 使 用 命令 ls -1 显示 文件 权限 时 ， 某 位 置 有 r、w 或 x， 表 示 某 类 用 户 对 文件 有 
相应 权限 ， 某 位 置 为 -， 表 示 无 对 应 权限 。 如 rw-r--r-- 表 示 文 件 主 有 读 、 写 权限 ， 无 执行 权限 ， 所 属 
用 户 组 的 用 户 和 其 他 所 有 用 户 仅 有 读 权限 ， 无 写 、 执 行 权限 。st_mode 的 位 9~11 仅 在 特殊 情况 下 使 
用 ,一般 为 0， 第 5 章 再 做 介绍 。 

对 于 普通 文件 、 管 道 和 设备 等 文件 来 说 ， 某 用 户 对 一 个 文件 有 T 权限， 是 指 该 用 户 能 读 这 个 文 
件 的 内 容 ; 有 w 权限 ,表示 能 更 改 文件 的 内 容 ; 有 x 权限 ,表示 能 执行 这 个 文件 代表 的 程序 或 命令 ， 
当然 ， 此 时 该 文件 应 该 是 可 执行 的 命令 文件 或 脚本 文件 。 

对 于 目录 文件 来 说 ， 权 限 解 释 有 所 不 同 。 某 用 户 对 目录 有 r 权限 ， 表 示 能 列 出 该 目录 的 内 容 ; 
有 w 权限 ， 表 示 能 在 该 目录 中 增加 或 删除 文件 ， 有 x 权限， 表示 能 用 cd 命令 进入 该 目录 。 

就 拿 下 面 的 文件 来 说 : 

-arx 1 can users 1234567 2015-02-0111:41 hello 

drwxrxr- 2 alice users 4096 2015-02-01 12:41 sub 

文件 hello 访问 权限 的 左边 三 位 rwx 表示 所 属 用 户 can 对 文件 hello 有 读 、 写 、 执 行 三 种 权限 ; 
中 间 三 位 r-x 表示 属于 用 户 组 users 的 用 户 对 文件 hello 有 读 、 执 行 权 限 ， 本 来 应 该 出 现 “w” 的 位 
置换 成 了 符号 “-”， 表 示 没 有 写 权限 ， 右边 三 位 r-x 表示 既 不 是 用 户 can 又 不 在 users 用 户 组 中 的 
用 户 对 该 文件 有 读 和 执行 权限 。 目录 sub 访问 权限 的 左边 三 位 rwx 表示 所 属 用 户 alice 能 列 出 目录 内 
容 、 在 该 目录 中 创建 和 删除 文件 、 能 进入 该 目录 ; 中 间 三 位 r-x 表示 用 户 组 users 中 的 用 户 能 列 出 目 
录 内 容 、 进 入 该 目录 ; 右边 三 位 呈 表 示 所 有 其 他 用 户 仅 能 列 出 目录 内 容 ， 既 不 能 进入 该 目录 ， 也 不 
能 在 该 目录 下 增删 文件 。 


1.4.3 Linux 文件 操作 命令 


1. 复制 、 移 动 与 删除 文件 (cp、rm、mv、In) 


在 Linux 系统 中 ， 复 制 文件 使 用 cp(copy) 命 令 ，cp 命令 的 用 途 有 很 多 ， 除 单纯 的 复制 功能 ， 还 
可 以 建立 符号 链接 文件 (相当 于 Windows 系统 的 快捷 方式 ， 其 中 保存 被 链接 文件 的 路 径 )、 比 对 两 个 
文件 的 新 旧 ， 从 而 予以 更 新 ， 以 及 复制 整个 目录 ， 等 等 。 

lndinl 命 令 用 于 创建 硬 链接 ard link) 与 符号 链接 (symbolic linl)， 硬 链接 为 同一 索引 节点 的 另 一 
文件 名 ， 符 合 链接 仅 为 某 文件 的 一 条 路 径 。 

mv(move) 命 令 用 于 移动 文件 或 目录 到 一 个 新 的 目录 位 置 ， 也 可 以 用 于 重 命名 (rename) 文 件 。 

ImCGemove) 命 令 用 于 移 除 文件 ， 不 但 可 删除 文件 ， 还 可 删除 目录 。 

(1) cp( 复 制 文 件 或 目录 ) 

命令 格式 : 
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Q@ 创建 一 个 文件 的 副本 

cp [-adfilprsu] 洲 廊 fsource) BAIRfHdestination) 

@ 将 多 个 选 定 文件 复制 到 某 目录 下 

cp [options] Socel source? source3 … directory 

常用 选项 

二 为 强制 (force) 的 意思 ， 若 目的 文件 存在 或 有 其 他 疑问 ， 不 会 询问 使 用 者 ， 而 是 强制 复制 。 
i: 若 目 的 文件 (destinatiom) 已 经 存在 ， 在 覆盖 时 会 先 询问 确认 。 

41: 创建 文件 的 硬 链接 ， 而 非 创建 一 个 新 文件 。 

< 递归 持续 复制 ， 用 于 复制 目录 。 

-s; 复制 创建 一 个 符号 链接 ， 符 号 链接 相当 于 Windows 环境 下 的 快捷 方式 。 

示例 1-1( 复 制 单 个 文件 ): 将 家 目录 下 的 .bashre 文件 复制 到 /tmp 目录 下 ， 将 文件 名 改 为 bashrc。 


Scd /mp # 进 入 /tmp 目录 
# 可 以 用 pwd 来 确认 是 否 进入 希望 的 目录 
Sq ~bashre bashre # 复 制 成 当前 目录 下 的 文件 bashrc bak 
$ # 立 即 显示 提示 符 $， 无 错误 报告 ， 命 令 执行 成 功 
示例 1-2( 复 制 单 个 文件 ): 将 wwarlog/wtmp 复制 到 /tmp 目录 下 ， 文 件 名 不 变 。 
Scd /Amp 
Sq harlogwimp . # 复 制 到 当前 目录 “.” 下 


Sls -1 Nariogwimp wimp 
-IW-IW-I— 1 root utmp 71808 Jul 18 12:46 /var/log/wtmp 


IW 1 root root 71808 Jul 18 21:58 wtmp 
示例 1-3( 复 制 整个 目录 ): 复制 /etc/ 目 录 中 的 所 有 内 容 到 /tmp 目录 下 。 


Scd Amp 

Sp fet/ /Amp # 由 于 复制 的 内 容 是 目录 ， 通 常 的 复制 方式 出 错 

cp: omitting directory "/etc” 

Sp -7 /etc//mp # 增 加 -r 选项 ， 复 制 成 功 

示例 1-4( 建 立 硬 链接 、 符 号 链接 ): 为 示例 1-1 复制 的 bashre 文件 建立 硬 链接 和 快捷 方式 。 
Sls -1 bashre 


-IW-I--I-- 1 root root 395 Jul 18 22:08 bashrc 
$ap -sbashre bashre_slink 避 In-s bashre bashre_slink # 建 立 符号 链接 (softlink) 
Sp -1 bashrebashrc_hlink 或 In bashrc bashrc_hlink  ”# 建 立 硬 链接 


Sls -! bashre* # 显 示 目 录 列 表 ， 以 验证 是 否 创建 成 功 
-IW-I--1-- 2 root root 395 Jul 18 22:08 bashrc 太 这 是 原来 的 文件 
-IW---1— 2 100t root 395 Jul 18 22:08 bashrc hlink # 这 是 新 建 的 硬 链接 

# 两 个 文件 的 链接 计数 都 变 为 2 
Jrwxrwxrwx 1rootroot 6Jul1822:31 bashre slink->bashre 

# 新 建 的 符号 链接 


示例 1-5( 同 时 复制 多 个 文件 ): 将 家 目录 中 的 .bashre 及 .bash history 复制 到 /tmp 目录 下 。 


Sp ~/bashre ~/bash history /mp 
5 


(2) mm( 移 除 文件 或 目录 ) 

命令 格式 : # mm [-f] 文件 或 目录 

常用 选项 

十 是 强制 移 除 的 意思 。 

二 互动 模式 ， 在 删除 前 会 询问 使 用 者 是 否 动 作 。 
工 递 归 删 除 ， 见 到 文件 删 文件 ， 见 到 目录 删 目 录 。 
示例 1-6: 复制 一 个 文件 ， 然 后 删除 。 


Scd Amp 

Sp ~Abashre bashre 

Srm _ bashre # 移 除 当前 目录 下 的 文件 bashrc 
示例 1-7: 删除 一 个 不 为 空 的 目录 。 

S$ mkdir test 

Sq ~bashre tesy/ # 将 文件 复制 到 test 目录 中 ，test 就 不 是 空 目录 了 
Srmdir test # 试 图 删除 test 目录 

rmdir: 'test: Directory not empty 。 # 删 | 不 掉 ， 因 为 test 不 是 空 目录 
Srm -ftest # 加 - 玫 选项 就 删除 成 功 了 

(3) mv( 移 动 文件 与 目录 ， 或 者 更 名 )。 

常用 格式 : 

mv [-fiu] source destination (文件 或 目录 更 名 ) 


mv [options] sourcel source2 source3 .… directory ” (文件 或 目录 移动 ) 

常用 选项 

二 强制 直接 移动 而 不 询问 。 

-it 若 目标 文件 (destination) 已 经 存在 ， 就 会 询问 是 否 覆 盖 。 

-u: 若 目 标 文件 已 经 存在 ， 且 源 文件 (source) 比 较 新 ， 则 更 新 (update)。 

示例 1-8( 移 动 单个 文件 ): 复制 一 个 文件 ， 建 立 一 个 目录 ， 将 复制 的 文件 移动 到 该 目录 中 。 


Scd Amp 

$cp ~/Abashre bashre 

Smkdir mvtest # 保 证 文件 要 移 去 的 地 方 作为 目录 已 经 存在 

Smy bashre mvtest # 将 文件 bashrc 移动 到 目录 mvtest 中 

$ 

示例 1-9( 目 录 更 名 ): 将 刚刚 建立 的 目录 mvtest 更 名 为 mvtest2。 
Smy_mvfest_mvfest2 # 执 行 该 命令 前 mvtest2 不 是 目录 ， 否 则 就 是 移动 目录 


示例 1-10( 移 动 多 个 文件 ): 再 建立 两 个 文件 ， 全 部 移动 到 /tmp/mvtest2 目录 中 。 


Sp ~/bashre bashrel 
Sp ~bashre bashre2 
Smy bashrcl bashrc2_ mvtest2 


”思考 与 练习 题 1.12 
@ 当前 登录 用 户 为 can, 在 其 主 目录 下 建立 工作 目录 work, 并 将 /home/NachOS-4.1 整个 目录 复 
制 到 work 目录 下 ， 写 出 会 话 过 程 ( 即 命令 序列 )。 
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@ 写 出 删除 /home/can/work/NachOS-4.1/ 整 个 目录 的 命令 。 


2. 查阅 文件 内 容 (cat、tac、head、tail、more、less、od) 


(1) 直接 检视 文本 文件 内 容 : cat、tac、head、tail 


检视 文本 文件 内 容 的 最 常用 命令 是 cat(catenate) 和 tac, cat 是 按 正 常 顺序 显示 内 容 , tac 则 逆序 显 


示 文 件 内 容 。 这 两 个 命令 仅 适 合 查看 较 小 文件 的 内 容 ， 


因为 它们 一 次 性 将 所 有 内 容 以 刷 屏 方式 显示 


在 终端 窗口 中 ， 实 际 上 最 后 展示 在 使 用 者 面前 的 只 是 最 后 一 屏 ， 要 看 前 面 的 文本 行 ， 需 要 通过 终端 
窗口 中 的 滚动 条 翻 回去 看 。 有 时 只 需要 查看 文件 的 前 若干 行 和 后 若干 行 ， 这 时 可 分 别 用 命令 head 


和 tail 来 做 。 
常用 格式 : 
# cat [-AEnTv] [文件 名 ] #tac [文件 名 ] 
# head 文件 名 #tail 文件 名 


cat 命令 经 常用 于 显示 文件 内 容 ， 下 面 仅 给 出 该 命令 的 使 用 范例 。 


示例 1-11: 检视 文件 /etc/passwd 的 内 容 。 
Scat /etcpasswd 

TOOt:x:0:0:root:/root:/bin/bash 
daemon:x:1:1:daemon:/usr/sbin:/bin/sh 


示例 1-12: 承接 上 例 ， 顺 便 打 印行 号 。 


Scat -n /etcpasswad 
1 root:x:0:0:root:/root:/bin/bash 
2 daemon:x:1:1:daemon:/usr/sbin:/bin/sh 


(2) 翻 页 检视 文本 文件 内 容 : more、less 


more 和 less 命令 按 翻 页 方式 在 屏幕 上 打印 文本 文件 内 容 ， 用 得 也 非常 多 。 不 


的 是 : more 命 


可 


令 按 翻 页 方式 向 下 显示 文件 内 容 ，less 命令 按 翻 页 方式 向 下 或 向 上 显示 文件 内 容 ， 因 此 使 用 more 命 
令 不 能 看 已 经 看 过 的 页 ， 而 使 用 less 命令 还 可 以 回 看 已 经 展示 过 的 页 。 常 用 格式 为 : 


more 哟 从 名 
less ”成 在 光 


对 于 一 页 显示 不 完 的 文件 ，more 和 less 命令 先 显示 第 一 页 ， 翻 页 的 方法 如 下 。 


e 空格 键 (space): 向 下 翻 一 页 。 

ee Enter 键 : 向 下 翻 一 行 。 

@ [page down]: 向 下 翻 一 页 。 

e [page up]: 向 上 翻 一 页 ， 仅 用 于 less 命令 。 


以 下 两 个 命令 还 提供 迅速 找到 所 需 内 容 页 面 的 方法 。 


e “/ 字 符 串 ”: 向 下 搜寻 字符 串 。 


ee “? 字 符 串 ”: 向 上 搜寻 字符 串 ， 仅 用 于 less 命令 。 


在 文件 内 容 尚未 展示 完毕 的 情况 下 ， 要 退出 命令 ， 


只 需要 键入 字母 “q”。 


示例 1-13: 用 more 或 less 命令 翻 页 检视 文件 /etc/passwd 的 内 容 。 


Smore /etcpasswd 


avahi-autoipd:x:103:108:Avahi autoip daemon...:/var/lib/avahi-autoipd:/bin/false 
avahi:x:104:109:Avahi mDNS daemon,..:/var/run/avahi-daemon:/bin/false 
—More—-(51%) 

Sless /etcpasswad 

avahi-autoipd:x:103:108:Avahi autoip daemon.,.:/var/lib/avahi-autoipd:/bin/false 
avahi:x:104:109:Avahi mDNS daemon...:/var/run/avahi-daemon:/bin/false 


二 = 思考 题 1.13 查看 /proc/mounts、/proc/cpuinfo、/proc/meminfo、/proc/version、/proc/uptime、 
/proc/devices、/proc/modules、/etc/passwd、/etc/shadow、/etc/fstab、/etc/group 文件 的 内 容 ， 猜 测 
它们 的 用 途 。 


非 文本 文件 (二 进 制 文 件 ) 的 内 容 一 般 通 过 特定 应 用 程序 查看 ， 如 数据 库 文件 的 内 容 需 要 通过 数 


据 库 管理 工具 查看 。 如 果 只 需要 知道 每 个 字 节 的 值 ,可 使 用 od 命令 。 假设 文件 test.txt 的 内 容 是 “ 计 
算 机 与 网 络 安全 学 院 ”， 用 od 命令 按 十 六 进 制 显 示 的 各 字 节 内 容 为 : 


Soqd -x testtxt 

0000000 e83b alae aee7 e697 ba9c b8e4 e78e 91bd 
0000020 bbe7 e59c 89ae 85e5 e5a8 a6ad 99e9 3ba2 
0000040 000a 

0000041 


其 中 ， 每 行 的 第 1 列 是 本 列 第 1 个 字 节 离 文件 起 始 处 的 八进制 偏 移 量 ， 该 文件 大 小 包括 换行 符 


在 内 为 33 字 节 ， 每 个 汉字 用 3 个 字 节 编码 。 


3. 创建 与 编辑 文件 (gedit、touch、dd) 
在 Linux 环境 下 ， 若 未 启动 图 形 界面 ， 可 用 vi 等 工具 创建 、 编 辑 源 程 序 等 文本 文件 。vi 的 启动 


命令 为 “vi 文件 名 ”， 详 细 使 用 方法 见 相关 参考 资料 ， 在 此 不 做 介绍 ， 若 已 启动 图 形 用 户 界 面 ， 一 
般 用 gedit 等 GUI 编辑 器 。 


(1) 用 gedit 创建 或 编辑 文本 文件 

常用 格式 : 

S gedit 芝 ff 名 

示例 1-14: 用 gedit 打开 源 程序 hl.c 并 进行 编辑 ， 命 令 为 S gedit hl.c &。 

命令 后 加 “&” 符 号 表示 在 后 台 执 行 命令 ， 并 立即 显示 命令 提示 符 ， 图 1-6 显示 了 gedit 编辑 器 


的 界面 。 


(2) 用 touch 命令 创建 空 文件 
touch 命令 一 般 用 于 创建 空 文件 ， 用 于 某 种 场合 。 常 用 格式 为 : 


Stouch 友人 #f 名 
示例 1-15: 在 /mp 目录 下 新 建 一 个 空 文件 testtouch。 


Sed /Amp 
Stouch festtounch 
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Sls -1 festtounch 
-WAI— lrootroot 0 Jul1920:49 testtouch 


创建 新 文件 打开 文件 保存 文件 


hi.c (home/can) - gedit 
Edit ew Searrh Docume 
7 
中 lOPen ~ save te Undo - 


hi.c 其 


#include <stdio.h> 
int main() 


printf("hello world"); 


| Cv | Tabwidth: 8 v Ln5,Col2 INS 


图 1-6 gedit 文 件 编辑 器 的 窗口 结构 


(3) 用 dd 命令 创建 指定 大 小 且 初始 化 为 0 的 文件 

dd 命令 可 用 于 创建 指定 大 小 、 内 容 不 做 要 求 的 文件 ， 用 于 某 种 场合 。 

命令 格式 为 : 

dd jlewrero 0 广 闷 华 厅 coun 太 = 英 烧 05- 英 大 外 

含义 是 : 从 设备 /dev/zero 创建 大 小 为 bs*count 字 节 的 文件 ， 总 共 从 设备 读 取 count 块 ， 每 块 大 
小 为 be， 因此 文件 大 小 为 bs*count。 由 于 从 设备 /dev/zero 读 出 的 数据 全 为 0， 因 此 新 建 的 文件 被 初 
始 化 为 0。 

示例 1-16: 在 /tmp 目录 下 创建 一 个 大 小 为 10MB 的 文件 testdd。 

Scd /Amp 

Sadd jewsero of-testdd count=10240 bs=1024 


Sls -1 testdd 
-IW-I--I-- lrootroot 0Jul1920:49 testtouch 


1.4.4 ”修改 文件 属性 


文件 通常 有 文件 名 、 链 接 计数 、 文 件 大 小 、 修 改 时 间 、 文 件 类 型 、 访 问 权 限 、 文 件 主 、 文 件 用 
户 组 等 属性 保存 在 索引 节点 (又 称 1 节 点) 中 ，i 节点 在 创建 文件 时 由 系统 分 配 。 所 有 文件 的 索引 节点 
位 于 磁盘 或 分 区 的 特定 区 域 ,每 个 i 节点 在 表 中 有 一 个 编号 ， 就 是 索引 节点 号 。 在 文件 诸多 属性 中 ， 
文件 名 可 用 mv 命令 修改 ; i 节点 号 在 文件 创建 时 分 配 ， 不 可 改变 ; 链接 计数 表示 有 几 个 名 字 指 向 同 
一 个 i 节点 (索引 节点 )， 由 系统 自动 维护 ; 文件 大 小 以 字 节 数 为 单位 , 在 用 户 向 文件 写 入 内 容 或 调整 
文件 大 小 时 由 系统 自动 修改 ; 修改 时 间 由 系统 更 新 为 最 后 写 入 文件 的 时 间 ; 文件 类 型 是 文件 固有 属 
性 ， 不 能 更 改 。 能 够 通过 专门 命令 修改 的 属性 主要 是 访问 权限 、 文 件 主 、 文 件 用 户 组 三 种 属性 ， 为 
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方便 某 种 需要 ,Linux 系统 也 允许 通过 命令 直接 更 新 文件 的 最 后 修改 时 间 . 比 如 将 “家 ”目录 的 Desktop 
子 目 录 的 修改 时 间 更 新 为 当前 时 间 。 


Sed 

Sls -4 -1 Desktop 

drwxI-xI-x 2 root root 4096 2012-08-21 17:31 Desktop 
Stouch Desktop 

Sls -d -1 Desktop 

drwxr-xr-x 2 root root 4096 2015-02-01 17:20 Desktop 


1. 文件 档案 权限 更 改 : chmod 


由 前 面 的 文件 访问 权限 说 明 可 知 ，Linux 文件 的 访问 权限 位 有 12 位 。 其 中 9~11 位 不 常 使 用 ， 
通常 取 值 为 0。 经常 使 用 的 是 0~8 位 ， 这 9 个 二 进 制 位 分 成 三 组 ， 从 高 到 低 分 别 为 文件 主 访问 权限 、 
所 属 用 户 组 访问 权限 、 其 他 用 户 访问 权限 。 例 如 rwxr-xr--，6~8 位 为 111( 显 示 为 rwx)， 表 示 文 件 主 
有 完整 的 读 、 写 、 执 行 权限 ; 3~5 位 为 101( 显 示 为 r-x)， 表 示 同 组 用 户 只 有 读 、 执 行 权限 ，0~2 位 为 
100( 显 示 为 +--)， 表示 其 他 用 户 仅 有 读 权 限 。 这 种 9 位 的 权限 正好 方便 用 三 位 八进制 数 754 表示 ， 因 
此 文件 权限 修改 命令 chmod 通 常 有 两 种 指明 文件 权限 的 格式 : 三 位 八进制 数 格式 和 rwxrwxrwx 格 式 。 

chmod 命令 的 基本 格式 为 : 

chmod [RJ 三 位 的 /\ 刘 制 蜡 六 从 丰 月 如 名 

chmod [-R] [wgo] [5-] [wx] 友信 或 月 如 

命令 说 明 : 

(1) 第 一 种 格式 直接 将 文件 档案 的 权限 设置 成 三 位 八进制 数 表示 的 权限 ，-R 命令 选项 表示 递归 
设置 (recursive)， 将 整个 目录 及 其 所 有 文件 设置 成 指定 权限 。 

(2) 第 二 种 格式 用 于 给 user( 文 件 主 )、group( 用 户 组 )、other( 其 他 用 户 ) 增 加 或 减少 某 种 权限 ， 如 
参数 utx 表示 给 文件 主 增加 执行 权限 ，g+w 表示 给 同 组 用 户 增加 写 权 限 ，o-r 表示 取消 其 他 用 户 的 
读 权限 ，ugotr 表示 给 文件 主 、 同 组 用 户 、 其 他 用 户 都 增加 读 权限 。 

示例 1-17: 在 /tmp 目录 下 创建 文件 全 2、f521、f522， 将 文件 f52 的 文件 权限 更 改 为 777， 为 所 
有 用 户 添加 对 名 21 文件 的 读 写 权限 ， 去 掉 所 有 用 户 对 人 522 文件 的 写 权限 。 

Scd /Amp 

Stouch /52 f521 /522 # 创 建 3 个 空 文件 

Sls 1 /52 f521 /1522 

-IW-IW-I— 1 xuqg xuqg OMar 5 18:31f52 

-IW-IW-I— 1 xuqg xuqg OMar 5 18:31f521 

-IW-IW-I— 1 xuqg xuqg OMar 5 18:31 £522 

Schmod 777 /52 # 将 文件 权限 设置 为 777， 即 rwxrwxrwx 


Schmod ugotrwm f521 或 chmodugtrw,otr,otwf52 
# 为 文件 主 (user)、 同 组 用 户 、 


# 其 他 用 户 (othen) 增 加 rw 权限 
$chmod ugo-w f522 # 对 三 类 用 户 (u、g、o) 减 去 w 权限 
$ls /52 J521 f522 -1 # 验 证 前 面 三 条 命令 的 执行 结果 的 正确 性 


-IWXIWXIWX 1 xuqg xuqg0 Mar 5 18:34 52 
-IW-IW-IW- 1] xuqg xuqg OMar 5 18:34f521 
-TI--I-I-- ] xuqgxuqg0Mar 5 18:34f522 


Lz 
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2. 文件 档案 归属 更 改 : chown、chgrp 


chown、chgrmp 命令 分 别 用 于 文件 主 、 文 件 所 属 用 户 组 ， 一 般 需要 root 权限 。 因 为 随意 改变 文件 
所 属 用 户 或 用 户 组 可 能 会 带 来 安全 问题 ， 所 以 这 种 操作 仅 允许 root 用 户 执行 。 基 本 格式 为 : 

chown BBE # 更 改 文件 所 属 用 户 名 

chermp 组 名 Kf 名 # 更 改 文件 所 属 用 户 组 

示例 1-18: 以 root 身份 登录 ， 在 /tmp 目录 下 创建 文件 全 3， 将 其 文件 主 、 所 属 用 户 组 分 别 更 改 
为 can、bin。 


#cd Amp 

#1ouch /53 

#1ls -1 /53 

-ITW-I--I- 1 root ro0t 0 2015-02-01 23:10 f53 #53 原来 属于 root 用 户 、root 用 户 组 


#chown can /52 

#chgrp bin f52 

Sk -1 /52 

-rw-r-r- 1 can bin 0 2015-02-01 22:10 {53 #153 现在 属于 can 用 户 、bin 用 户 组 


和 ”思考 与 练习 题 1.14 

(1) 一 个 Linux 文件 的 八进制 数 访问 权限 为 755, 用 ls -1 命令 显示 的 文件 权限 是 什么 ? 假设 用 ls 
-命令 显示 的 文件 权限 是 rw-r--r--， 用 八进制 数 表示 的 权限 值 是 多 少 ? 

(2) 写 出 命令 ， 在 当前 目录 下 创建 文件 全 4， 将 其 访问 权限 设置 为 664。 

(3) 当前 目录 下 文件 test.sh 的 权限 是 rw-r--r--， 成 功 执 行 命令 chmod +x testsh 后 ，testsh 文件 的 
权限 变 成 ， 用 八进制 数 表示 为 


1.4.5 ”使 用 通配符 (“*” 和 “? ”) 匹 配 文件 名 


前 面 的 文件 操作 命令 仅 对 一 个 文件 或 目录 进行 操作 ， 但 cp、mv、rm 等 命令 应 该 可 以 对 多 个 文 
件 或 目录 进行 复制 、 移 动 、 删 除 操作 。 选 择 多 个 文件 或 目录 有 两 种 方法 。 一 种 是 直接 列 出 待 访问 的 
多 个 文件 名 或 目录 名 ， 例 如 : 

mm mm # 同 时 删除 两 个 文件 角 和 也 

钙 让 ?7 personal  ”# 同 时 将 两 个 文件 复制 到 目录 personal 中 

另 一 种 方法 是 使 用 通配符 指出 文件 名 或 目录 名 ， 常 用 的 通配符 有 以 下 两 个 。 

*: 匹配 任何 字符 串 。 

?: 匹配 任何 一 个 字符 。 

示例 1-19: 在 /tmp 目录 下 创建 两 个 文件 但 和 亿 ， 将 所 有 文件 名 以 企 开 头 、 长 度 为 3 个 字符 
的 文件 复制 到 目录 personal 中 。 

Sed Amp 

Smkdir personal 

Stouch WN 


Smy JP personal 
Sls personal 


示例 1-20: 删除 personal 目录 下 所 有 名 字 以 企 开 头 的 文件 。 


Scd /mp 
Srm personalff* 
Sls personal 


示例 1-21: 删除 personal 目录 下 的 所 有 文件 、 目 录 ， 包 括 子 目录 。 


Scd /Amp 
Srm personal/* -1f 
Sls personal 


及 ”思考 与 练习 题 1.15 
(1) 写 出 命令 ， 删 除 当前 目录 下 所 有 文件 名 以 “f'” 开头 的 文件 和 以 “.o” 结 尾 的 文件 。 
(2) 写 出 命令 ， 显 示 所 有 文件 名 仅 包含 两 个 字符 的 文件 。 


1.4.6 文件 的 压缩 与 打包 


在 系统 管理 和 编程 开发 中 ， 经 常 需要 对 一 批文 件 (一 个 目录 或 满足 某 种 条 件 的 一 些 文件 ) 进 行 打 
包 、 压 缩 ， 以 便 发 布 、 传 播 等 ， 也 需要 对 压缩 文件 、 打 包 文 件 执行 解压 缩 、 解 包 操 作 。Linux 系统 
提供 了 compress、gzip、bzip2、tar、bzcat、dd、cpio 等 一 系列 工具 ， 能 满足 不 同 场景 下 打包 、 解 包 
之 需 。 


1. 文件 的 压缩 与 打包 命令 (compress、gzip、bzip2、tar、bzcat、dd、cpio) 


compress、gzip、bzip2 命令 采用 不 同 的 压缩 算法 ， 能 实现 单个 文件 的 压缩 、 解 压缩 tar 命令 用 
于 多 文件 的 打包 、 解 包 ， 该 命令 还 可 以 通过 命令 选项 来 调用 压缩 命令 ， 对 打包 后 的 文件 进行 压缩 ， 
或 先 对 文件 解压 缩 ， 再 解 包 。 各 命令 的 主要 功能 如 下 。 

ecompress: 压缩 文件 ， 压 缩 后 绥 为 .z。 

e gzip: 压缩 文件 ， 压 缩 后 缀 为 .gz。 

e bzip2: 压缩 文件 ， 压 缩 后 缀 为 .bz2。 

e tar: 打包 一 批文 件 ， 包 文件 后 级 为 .tar。 

通常 将 tar 与 gzip 或 bzip2 命令 结合 起 来 执行 打包 与 压缩 操作 。 

常用 格式 : $ tar < 选项 > [压缩 文件 ] < 文件 列表 > 

常用 命令 选项 : 

-cvf ”打包 -xvf 解 包 

-zcvf 打包 并 压缩 成 .gz 格式 文件 -Zevf 先 对 .gz 文件 解压 缩 ， 再 解 包 

-cjvf 打包 并 压缩 成 bz2 格式 文件 。”-xjvf” 先 对 .bz2 文件 解压 缩 ， 再 解 包 

示例 1-22: 在 当前 目录 下 创建 目录 dir5， 在 其 中 创建 4 个 文件 生 、 包 、 全 、 苹 ， 对 该 目录 打包 
并 压缩 成 文件 dir5.tar.gz， 删 除 该 目录 ， 然 后 解 包 dir5.gz. 

Smkdir dirs 

Scd dirs 

Stouchk J1 1 RBA # 创 建 4 个 空 文件 

Sed .. 雪 进 入 父 目 录 


Slsdirs # 列 出 目录 dir5 下 的 文件 列表 
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颂 介 全 才 
Star -ze dirstar.gz dir5  # 将 整个 目录 dir5 打包 后 压缩 成 dir5.tar.gz 
# 也 就 是 对 目录 dir5 进行 备份 
Srm of dirs # 删 除 目 录 dit5 
Sls dirs # 列 出 目录 dir5 下 的 文件 列表 ， 该 目录 已 不 存在 
ls: cannot access dir5: No such file or directory 
Siar -eo dirs.argz # 解 压缩 并 解 包 文件 dir5 .tar.gz 
Sls dirs 者 给 证 目录 dir5 是 否 被 成 功 恢复 
和 


2. 在 Windows 主机 与 Linux 虚拟 机 之 间 进 行文 件 互 传 


在 本 课程 实验 中 , 经常 需 要 将 在 Linux 虚拟 机 上 创建 的 文档 或 源 程序 导出 到 Windows 主机 , 或 
进行 反 向 传输 。 可 通过 简单 的 拖 放 操作 在 Windows 主机 与 VMware Linux 虚拟 机 之 间 进 行文 件 互 传 。 

(1) Linux 虚拟 机 到 Windows 主机 的 文件 传输 方法 

将 Linux 虚拟 机 上 的 文件 用 tar 命令 打包 成 一 个 压缩 文件 ， 打开 Linux 的 文件 管理 器 , 将 压缩 文 
件 拖 到 Windows 主机 上 的 某 个 文件 夹 (桌面 即 可 ) 中 。 

(2) Windows 主机 到 Linux 虚拟 机 的 文件 传输 方法 

打开 Linux 文件 管理 器 ,将 打包 并 压缩 好 的 文件 从 Windows 系统 拖 到 Linux 系统 中 的 指定 位 置 ， 
用 双击 操作 和 tar 命令 对 压缩 文件 解压 缩 和 解 包 即 可 。 

(3) 请 参考 视频 演示 “Linux 文件 目录 压缩 解压 缩 及 与 Windows 系统 间 文 件 互 传 (演示 ).exe”。 
和 ”思考 与 练习 题 1.16 ” 写 出 命令 ， 将 目录 work 下 的 所 有 .c 源 代 码 文件 打包 压缩 成 prog.tar.bz2， 
并 传 到 Windows 主机 。 
如 = 思考 与 练习 题 1.17 写 出 命令 ,将 Windows 主机 上 的 Web 服务 器 源 代码 包 boa-0.94.13.tar.gz 
传送 到 Linux 虚拟 机 ， 解 压缩 并 解 包 ， 展 开 其 目录 结构 。 


输入 输出 重 定向 和 管道 


Linux 环境 有 很 多 有 用 的 特性 可 以 给 命令 操作 带 来 极 大 便利 。 除 前 面 介绍 的 相对 路 径 、 特 殊 目 
录 名 、 通 配 符 外 ， 还 有 输入 重 定向 、 输 出 重 定向 和 管道 。 输 入 重 定向 是 指 本 来 需要 从 终端 读 取 输入 
数据 的 命令 ， 可 通过 符号 “<” 改 从 文件 读 取 。 输 出 重 定向 是 指 将 命令 的 正常 输出 改 送 到 文件 而 非 
终端 ， 重 定向 的 方法 是 在 命令 串 后 用 “>” 或 “>>” 指 明 输出 文件 名 。 输 出 重 定向 可 将 比较 长 的 输 
出 先 保存 起 来 ， 以 后 再 查看 分 析 。 管 道 是 指 用 一 个 “|” 符 号 将 两 个 命令 连 起 来 ， 将 前 一 命令 的 输出 
直接 作为 后 一 命令 的 输入 。 

下 面 是 一 个 范例 : 


Sman passwd>a # 将 前 一 命令 给 出 的 passwd 联机 帮助 重 定向 到 文件 a 
## 要 盖 文 件 a 的 所 有 内 容 
Sdate >>a # 将 命令 date 给 出 的 日 期 时 间 信息 追加 到 文件 a 
Scat < /etcpasswd # 不 带 参 数 的 cat 命令 本 来 是 从 终端 读 取 输 入 
##j 通 过 输入 重 定向 改 从 文件 读 取 
Smore /etcpasswa | sort # 将 文件 /etc/passwd 的 内 容 送 往 命令 sort 排序 输出 


Sfind ~ -name"*.c"|more  _ #find 命 令 在 当前 用 户 的 家 目录 树 中 查找 所 有 文件 名 


# 后 级 为 c 的 文件 信息 交 由 more 分 页 显示 


Sgrep -7 maain0|more #erep 命令 在 当前 目录 树 文件 中 搜索 包含 


#'main()" 的 文本 ， 交 由 命令 more 分 页 显示 


本 章 小 结 


本 章 主要 讲述 Linux 系统 的 基本 知识 、 目 录 结构 、 文 件 属性 、 访 问 权 限 ， 重 点 介绍 Linux 系统 
常用 的 文件 操作 命令 ， 为 日 后 在 Linux 环境 下 进行 编程 打下 基础 。 和 希望 深入 学 习 Linux 操作 使 用 的 
读者 ， 可 参考 专门 的 参考 书 。 表 1-2 汇总 了 Linux 系统 常用 的 用 户 操作 命令 。 


表 1-2 Linux 系统 常用 的 用 户 操作 命令 列表 


序号 功能 命令 名 常用 格式 举例 
1 列 出 文件 列表 ks、dir Ds ©@ls - ks -al 
@ls /etc @ls -l ~ 
ls_ ~root Ds -F /tmp 
多 显示 当前 工作 目录 路 径 [pw | pw 
3 切换 工作 目录 ed me @cd. @cd ~ 
Cpcd ~root 
4 创建 文件 目录 Dmkdir dil Dmkdir -p dir2/dir3 
5 删除 空 目录 rmdir dir2/dir3 
6 复制 文件 Dcp /etc/passwd 
@cp /tmp/la* work 
@cp ~/bashre bashrcbak 
@cp -ff /home/NachOS-4.1 work 
cp -s -~/bashrc bashrc slink 
i 建立 硬 链接 和 符号 链接 Qcp -1 ~/bashre bashre_hlink 或 
In ~/bashre bashre_slink 
@cp -s -~/bashrc bashrc slink 或 
ln -s ~/.bashre bashre slink 
8 删除 文件 | Dr bashr Dm -df test* 
删除 目录 (包括 非 空 目录 ) rm /tmp/la? ”CDm /tmp/b* 
9 移动 、 更 名 文件 、 目 录 mv filel fle? Dmv flel dirl 
mv dirl di2 mv /tmp/e* ./dirl 
10 显示 文本 文件 内 容 cat、 tac, more、, less | CDcat /etc/passwd 
@tac /etc/passw 
more /etc/passwd 
1 创建 文本 文件 
12 创建 空 文件 ， 更 新 文件 修改 时 间 | touch Dtouch £521 
touch ~/Desktop 
13 修改 文件 权限 chmod CDchmod ugotrw f521 
@chmod 777f52 
14 更 改 用 户 、 用 户 组 chown Drhgp bin £52 
chgm @chown can f52 
15 文件 /目录 的 打包 、 压 缩 与 解压 | tar tar -zcvf dirstargz dirs 
缩 、 解 包 tar -zxvf dir5targ 
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课 后 作业 


喝 ” 思考 与 练习 题 1.18 不 考虑 操作 权限 因素 ， 下 面 哪些 Linux 命令 是 正确 的 ? 哪些 不 正确 ， 存 在 
什么 问题 ? 


(1D)ls -ial (5)ls -Vetc (9)1s-1 /home 
Ols -il (Ocp /etc/passwd /tmp (10)Ls / 

(3) ls/home/can (7)cp /etc/passwd . (ll)ls \etc 
4)ls-l /etc 8 /etc/passwd /| 


喝 ” 思考 与 练习 题 1.19 写 出 显示 根 目录 “/” 下 各 文件 (包括 隐藏 文件 ) 所 有 属性 (包括 i 节点 号 ) 的 命 
令 ， 说 出 根 目 录 的 i 节点 号 是 什么 为 何 “.” 与 “..” 这 两 个 文件 具有 相同 的 i 节点 号 ? 目录 “/” 
的 链接 计数 是 多 少 ? 为 何 是 这 个 值 ? 
喝 ” 思考 与 练习 题 1.20 根据 命令 执行 后 的 出 错 信息 判断 是 缺少 什么 权限 所 致 : 

命令 及 输出 

bash: cd: /root: Permission denied 


$ls /root 


当前 用 户 对 目录 /toot 缺少 何 种 权限 所 致 ? 


1s: cannot open directory /root: Permission denied 
$mkdir /root/work 
mkdir: cannot create directory ‘/root/work’: Permission denied 


驶 思考 与 练习 题 1.21 图 1-7 为 Linux 系统 目录 树 结构 的 一 部 分 。 


根 目录 (/) 
AAA 
一 一 一 天 / Ws 
/pb 环 Ta5B fe /beot 


NT 
a / AN / 去 \ 
/E60ot /john /nike fpin /sbin /log 


图 1-7 Linux 系统 目录 树 结构 的 一 部 分 
请 问 : 
(1) 用 户 john 与 用 户 root 的 家 目录 在 哪里 ? 


(2) 车 当前 工作 目录 是 /home/john， 请 给 出 目录 mike、usr 的 相对 路 径 与 绝对 路 径 。 
(3) 车 当前 用 户 为 john， 请 用 符号 “~” 给 出 目录 mike、home 的 相对 路 径 。 
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Linux Shell 编 程 


Linux 中 的 Shell 作为 用 户 与 操作 系统 的 接口 ， 是 用 户 使 用 操作 系统 的 窗口 。Shel 既是 命令 解 
释 器 ， 又 是 一 种 编程 语言 。 作 为 命令 解释 器 ，Shell 是 一 个 终端 窗口 ， 接 收 用 户 输入 的 命令 ， 识 别 、 
解释 、 执 行 该 命令 ， 并 向 用 户 返 回 结果 ，Shell 的 功能 类 似 于 Windows 系统 中 的 cmd.exe 程序 。 作 为 
编程 语言 ，Shell 提供 了 变量 、 流 程控 制 结 构 、 引 用 、 函 数 、 数 组 等 功能 ， 可 将 公共 程序 、 系 统 工具 、 
用 户 程序 “ 粘 合 ”在 一 起 ， 创 建 Shell 脚本 (又 称 Shell 程序 )， 实 现 更 加 复杂 的 应 用 功能 。Linux 系统 
的 很 多 管理 任务 是 通过 Shell 脚本 实现 的 ， 例 如 ，Linux 系统 启动 过 程 就 是 通过 运行 /etc/re.d 目录 中 
的 脚本 来 执行 系统 配置 和 建立 服务 的 。Shell 脚本 还 用 于 用 户 工作 环境 的 定制 ， 如 Java 开发 环境 、 
Android 开发 环境 、 大 数据 应 用 开发 环境 等 ， 都 是 通过 Shell 脚本 来 设置 的 。 掌 握 一 些 基本 的 Shell 
脚本 编程 知识 对 操作 、 使 用 Linux 有 帮助 .每 个 Linux 系统 发 行 版 本 中 都 包含 多 种 Shell, 一 般 有 Bash、 
Boume Shell、TC Shell、C Shell 和 Kom Shell 等 。 其 中 ，Bash 是 Boume-Again Shell 的 英文 缩写 ， 
它 吸收 和 继承 了 其 他 Shell 的 优点 ， 成 为 当前 应 用 最 广泛 的 Shell， 是 Linux Shell 的 事实 标准 。 


本 章 学 习 目 标 : 

e 掌握 Shel 脚本 、 变 量 、 表 达 式 、 数 学 运算 、 字 符 串 处 理 、 输 入 输出 的 语法 结构 。 
掌握 使 用 Shell 条 件 和 条 件 、 选 择 、 循 环 三 大 控制 结构 的 基本 编程 方法 。 
理解 全 局 变量 、 局 部 变量 、 环 境 变量 、 命 令 行 参数 的 基本 概念 与 用 途 。 

掌握 文件 IO 和 1O 重 定向 的 基本 编程 方法 。 

理解 Shell 函数 。 


Shell 编程 基本 概念 


Shell 脚本 就 是 由 很 多 Linux 命令 通过 Shell 控制 结构 粘 合 起 来 构成 的 文本 文件 , 一 个 Shell 脚本 
可 当 作 一 条 Linux 命令 来 执行 ， 以 高 效 方式 完成 较为 复杂 的 管理 控制 功能 ，Shell 脚本 又 称 Shell 
程序 。 
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2.1.1 Shell 脚本 程序 的 结构 


组 成 Shell 脚本 的 语句 可 包括 Linux 命令 、 赋 值 语 句 、 输 入 输出 语句 和 流程 控制 结构 。 下 面 的 
shscri.sh 是 一 个 Shell 脚本 程序 实例 : 


#1/bin/bash 
list= ls./temp” 

for f in Slist 

do 

mv /temp/$f Jiemp/Sftxt 
done 
echo finished! 


eawhewnb 


第 1 行 是 一 个 特殊 的 注释 行 (所 有 以 字符 # 开 头 的 脚本 行 都 是 注释 行 )， 它 用 符号 “者 ” 指 明 本 肢 
本 程序 应 该 用 Shell 程序 /bin/bash 来 解释 执行 脚本 。 第 2 行将 当前 目录 下 的 文件 名 列表 赋 给 变量 list， 
赋值 表达 式 'ls ./temp ' 是 一 个 用 反 引 号 () 括 起 的 命令 ， 表 示 该 命令 的 输出 为 表达 式 值 ， 即 .temp 目录 
下 的 文件 列表 。 第 3~6 行 是 一 个 for 循环 ， 第 3 行 表示 变量 f 依 次 取 变 量 list 中 的 每 一 项 ， 执 行 for 
循环 体 ， 其 中 变量 名 前 加 美元 符号 $( 即 Slisb 表 示 引 用 变量 list 的 值 ，do 与 done 之 间 为 循环 体 ， 仅 包 
含 一 条 语句 ， 它 对 ./temp 目录 下 文件 名 为 变量 值 的 文件 添加 后 缀 “kt”。 第 7 行 的 echo 命令 输出 
信息 “finished!”， 表 示 脚 本 执行 完毕 。 


2.1.2 ”Shell 脚本 的 创建 与 执行 方法 


Shell 脚本 程序 是 文本 文件 ， 可 以 用 任何 文本 编辑 器 来 创建 ， 如 gedit、vi、kate 等 ， 甚 至 可 以 在 
Windows 环境 下 创建 好 ， 复 制 到 Linux 系统 中 。 

为 了 执行 2.1.1 节 中 的 Shell 脚本 shscri.sh， 我 们 先 创建 目录 ./temp 以 及 该 目录 下 的 一 些 文件 : 

Smkdir /temp 

Stouh A PRB A 

Shell 脚本 程序 本 身 并 不 含 CPU 直接 执行 的 机 器 指令 ， 其 中 的 指令 或 语句 由 第 1 行 指定 的 Shell 
命令 解释 器 解释 执行 。 在 前 面 的 例子 中 ，Shell 命令 解释 器 是 /bin/bash。 运行 Shell 脚本 程序 实际 上 是 
执行 /bin/bash，bash 从 脚本 文件 中 逐条 读 入 Shell 指令 ， 解 释 执 行 ，Shell 脚本 实际 上 只 是 bash 的 一 
个 数据 文件 。 因 此 ， 前 面 Shell 脚本 的 运行 方法 和 结果 是 : 

$bash shscrish 

finished! 

可 以 通过 查看 /temp 目录 下 的 文件 列表 来 检查 脚本 shscri.sh 是 否 执行 成 功 。 

既然 脚本 shscri.sh 是 Linux Shell 脚本 命令 ,就 应 允许 我 们 直接 输入 文件 路 径 和 文件 名 以 执行 它 。 
Linux bash 接收 到 用 户 输入 的 命令 时 ， 首 先 对 用 户 权限 进行 检查 ， 仅 当 用 户 有 执行 权限 时 ， 才 会 执 
行 命令 或 脚本 。 如 果 输入 的 文件 名 代表 可 执行 的 二 进 制 文件 ，Linux 就 直接 加 载 执行 ， 如 果 输 入 的 
文件 名 代表 文本 文件 ，Linux 就 会 根据 脚本 第 1 行 的 “ 执 .….” 去 找 相关 的 解释 程序 ， 然 后 启动 相应 的 
解释 程序 来 执行 脚本 命令 。 因 此 ， 如 果 给 shscri.sh 添加 执行 权限 : 

Schmod +x shscrish 


Sls -1 shscrish 
-IW-IW-I— 1 xuqg xuqg 104 Jul 15 16:44 shscish 


就 可 以 输入 完整 路 径 以 直接 执行 它 : 

S$ /shscrish 

finished! 

上 述 命 令 串 中 ，“./” 是 脚本 文件 shscri.sh 所 在 目录 ， 因 为 “.” 代 表 当 前 工作 目录 。 

对 于 未 添加 执行 权限 的 任何 文件 (包括 Linux 命令 文件 ， 如 果 直 接 输入 文件 路 径 或 文件 名 并 试 
图 运行 它 ，Linux 会 显示 权限 不 允许 的 错误 信息 ， 例 如 : 

$1 -万 


-ITW-IW-I 一 1 xuqg xuqg 0Jull1516:58f1 


$A 
bash: ./f1: Permission denied 


2.1.3 Shell 变量 与 赋值 表达 式 


Shell 程序 中 一 些 命令 产生 的 数据 常常 会 被 传 给 其 他 命令 以 做 进一步 处 理 , 这 可 以 通过 变量 来 完 
成 。 变 量 允 许 临 时 性 存储 信息 ， 供 脚本 中 的 其 他 命令 使 用 。 

用 户 变量 可 以 是 任何 不 超过 20 个 字母 、 数 字 或 下 划 线 的 文本 字符 串 , 用 户 变量 区 分 大 小 写 , 所 
以 变量 Varl 和 变量 varl 是 不 同 的 。Shell 变量 的 使 用 非常 灵活 ， 不 必 事 先 定义 变量 ， 在 给 变量 赋值 
时 会 自动 获得 定义 。Shell 变量 值 的 类 型 都 是 字符 串 ， 可 以 将 任何 字符 串 赋 值 给 变量 。 值 通过 等 号 直 
接 赋 给 用 户 变量 ， 在 变量 、 等 号 和 值 之 间 不 能 出 现 空格 。 如 果 字 符 串 值 的 中 间 有 空格 ， 应 用 引号 括 
起 。 这 里 是 一 些 给 用 户 变量 赋值 的 例子 

varl=10 

Var2=57 

var4=testing 

var4="still more testing" 


Shell 变量 的 赋值 表达 式 可 以 由 字符 串 常量 、Shell 变量 引用 、Linux 命令 输出 直接 拼接 而 成 ,但 
要 注意 以 下 几 点 : 

(1) 为 区 分 字符 串 常量 和 变量 引用 ，Shell 要 求 通过 美元 符号 ($) 来 引用 变量 。 

(2) 若 被 引用 的 Shell 变量 名 后 紧 接 着 字母 、 数 字 、 下 划 线 等 字符 ， 则 应 将 变量 名 用 花 括 号 ({}) 
括 起 ， 否 则 bash 无 法 从 中 正确 提取 变量 名 。 

(3) 为 区 分 赋值 表达 式 中 的 Linux 命令 和 字符 串 常量 ，Linux 命令 需要 用 反 引 号 () 括 起 。 

(4) 未 经 定义 的 Shell 变量 也 可 引用 ， 只 是 变量 值 为 空 值 。 

当然 赋值 表达 式 的 值 也 可 用 命令 echo 直接 显示 和 输出， 在 echo 命令 中 ， 串 表达 式 的 中 间 人 允许 存 
在 空格 而 两 边 不 用 加 引号 。 

下 面 的 exvar.sh 是 一 个 使 用 变量 的 Shell 脚本 示例 : 


#1/bin/bash 

#testing variables 

num=3 

guestl=Alice 

guest2="Bill Gates" 

mse—"$guest] logs out before the $ {num}th day." 
echo $msg 

echo "current directory of ${guest?} is pwd." 


和 > 


o auwhwnb 一 
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在 第 5 行 中 , 变量 赋值 语句 右边 的 字符 串 中 间 有 空格 ,用 引号 将 整个 字符 串 括 起 ; 第 6 行 用 $ 符 
号 引用 变量 num 的 值 ， 因 为 变量 名 后 紧 接 着 字符 串 常 量 也 ， 所 以 将 变量 名 用 花 括号 } 括 起 ; 第 8 行 
要 获得 命令 pwd 的 输出 ， 因 此 在 pwd 两边 加 反 引号 。 下 面 Shell 脚本 输出 结果 : 

Schmod +x exvar.sh 

S$ /exvar.sh 

Alice logs out before the 3th day. 

current directory of Bill Gates is /home/xuqg/temp. 
5 思考 与 练习 题 21 下 面 的 Shell 脚本 存在 多 处 错误 ， 每 行 都 有 错 ， 请 指出 来 并 予以 更 正 。 

#!bi n/bash 

varl=5 

Var2=hello world 

Var3=$var2abcd 

echo 我 的 当前 目录 是 : pwd 


2.1.4 _ Shell 输入 输出 语句 


Shell 脚本 用 echo 命令 将 包含 变量 值 、 字 符 串 常量 、 命 令 输出 的 表达 式 值 显示 出 来 ， 如 前 面 示 
例 所 示 。Shell 脚本 用 read 命令 让 用 户 从 键盘 终端 输入 信息 ， 存 入 Shell 变量 。read 命令 的 格式 是 : 
read [-s] [-p prompt] variablel variable2 ... 


上 述 语法 表示 将 用 户 输入 的 多 个 字符 串 依次 存 入 Shell 变量 variablel、variable2、.…. 使 用 bash 
命令 提取 输入 时 ， 以 空格 作为 字符 串 分 隔 符 。bash 命令 有 两 个 命令 选项 ， 这 里 用 方 插 号 括 起 ， 表 示 
命令 选项 根据 需要 可 选 。 

e -pprompt: 表示 在 提示 用 户 输入 前 显示 提示 串 prompt。 

e _-s: 表示 默读 ， 用 户 输入 信息 时 无 任何 显示 ， 用 于 输入 密码 等 敏感 信息 。 

以 下 脚本 io.sh 是 使 用 案例 : 

#1/bin/bash 
#testing read and echo commands 
read -p "Enteryourname:" firstlast 


echo "Checking data for $lastS$first" 
read -sp" 请 输入 您 的 密码 : " pass 
echo "Is your password really $pass?" 


脚本 执行 结果 如 下 : 


Schmod +x io.sh 

$/io.sh 

Enter your name: Bill Gates 

Checking data for Gates. BL 

请 输入 您 的 密码 :123456 ”# 输 入 的 密码 不 显示 
Is your password really 123456? 


2.1.5 ”终止 脚本 执行 和 终止 状态 


bash 启动 的 一 条 命令 或 一 个 脚本 运行 完毕 后 , 我 们 经 常 需要 了 解 命令 或 脚本 的 执行 情况 , 成 功 、 
失败 , 还 是 压根 就 没有 执行 。 如 果 失 败 , 是 什么 原因 所 致 。 后 续 命令 需要 根据 终止 状态 做 不 同 处 理 。 
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因此 ， 在 Linux 系统 中 ， 任 何 命令 、 脚 本 执行 完毕 后 ， 都 有 终止 状态 ， 即 使 命令 根本 没有 执行 或 不 
存在 ， 也 会 有 终止 状态 。 

按照 Linux 系统 规范 ， 命 令 或 脚本 的 终止 状态 码 是 一 个 介 于 0 和 255 的 整数 ， 一 般 0 代表 执行 
成 功 ，>0 代表 执行 失败 。 命 令 或 脚本 的 终止 状态 有 用 户 设置 和 系统 设置 两 种 情况 。 

(1) 用 户 设置 终止 状态 码 

高 级 编程 语言 和 bash 都 提供 了 系统 函数 或 命令 来 结束 程序 或 脚本 的 执行 ， 并 设置 终止 状态 码 。 
在 C 语 言 程序 中 , 用 系统 函数 exit0 来 终止 程序 , 设置 终止 状态 。 在 bash 中 , 用 命令 exit 终止 脚本 ， 
设置 终止 状态 ， 格 式 为 : 

exit 状态 码 

状态 码 为 0 表示 脚本 执行 成 功 ， 为 非 0 表示 执行 失败 ， 非 0 编码 与 失败 原因 之 间 的 对 应 关系 由 
编程 人 员 自行 定义 。 

(2) 系统 设置 终止 状态 

如 果 C 程序 没有 执行 exit0 函 数 调用 ， 则 其 终止 状态 码 为 程序 最 后 一 个 函数 调用 的 返 
果 Shell 脚本 没有 执行 exit 命令 ， 则 其 终止 状态 码 为 最 后 执行 的 命令 的 终止 状态 码 。 

如 果 用 户 输入 的 命令 或 脚本 根本 就 不 存在 或 根本 没有 执行 ， 或 者 Linux 命令 、Shell 脚本 非 正常 
终止 , 则 其 状态 码 由 Linux 系统 根据 失败 原因 自动 设 定 , 这 时 每 个 编码 都 有 特定 含义 。 表 2-1 是 Linux 
命令 、 脚 本 的 常见 终止 状态 及 描述 。 


五 


值 ， 如 


表 2-1 Linux 命令 、 脚 本 的 常见 终止 状态 及 描述 
命令 成 功 完成 


无 效 的 终止 参数 
命令 无 法 执行 使 用 Linux 信号 的 致命 错误 


没有 找到 命令 使 用 CtltC 终止 进程 
Linux 将 进程 (命令 、 脚 本 的 执行 ) 的 终止 状态 保存 在 一 个 特殊 的 Shell 变量 (?) 中 ， 可 在 进程 结束 


时 ， 立 即 读 取 该 变量 的 值 以 取得 前 一 个 命令 或 脚本 的 终止 状态 。 因 为 读 取 $? 变 量 值 的 命令 也 是 一 条 
命令 ， 所 以 bash 会 根据 这 条 命令 的 终止 状态 更 新 变量 8? 的 值 。 表 2-2 中 是 一 些 示 例 。 
表 2-2 使 用 环境 变量 $? 获 取 命 令 返 回 值 的 一 些 示例 
命令 类 别 命令 或 程序 示例 解释 说 明 
Linux 命令 Sdate 该 命令 执行 成 功 ， 其 终止 状态 码 为 0 

Sat Sep 29 10 : 01: 30 EDT 2007 
Secho $5? 
0 
Sasqdfg 该 命令 不 存在 ， 其 终止 状态 码 为 127， 因 此 第 
-bash: asdfg: command not found 1 个 echo $? 的 输出 为 127; 由 于 第 1 个 echo $? 
Secho 3? 命令 执行 成 功 ， 它 把 9? 设 置 成 0， 这 样 第 2 个 
127 echo $? 的 输出 为 0 
Secho 53? 
0 
S$ /mprog.c myproc.c 虽然 存在 ， 但 无 执行 权限 ， 其 终止 
-bash: /myprog.c: permissi on denied 状态 码 为 126 
$echo 32 
126 
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命令 类 别 


命令 或 程序 示例 


( 续 表 ) 
解释 说 明 


Shell 脚本 


Linux C 程序 


statusl sh 
#/bin/bash 

pwd 

$bash ./statusl.sh 
Secho 5? 

0 

status2.sh 
#bin/bash 

exit 0 

Spbash /status2.sh 
Secho $5? 

0 

status3.sh 
#bin/bash 

exit 10 

Spbash /status3.sh 
Secho 5? 

10 

Status4.c 

int main0 
{exit(5); 

} 

Secc -o status4 status4.c 
§ /status4 

Secho $5? 

5 

Status5c 

int main0 

{ atoi("123"); 
} 

Sgcc -0 status5 status6.c 
S$ ./status5 

Secho 5? 

123 


该 脚本 的 最 后 一 条 命令 执行 成 功 ， 其 终止 状 
态 码 为 0 


该 脚本 的 最 后 一 条 命令 是 exit0， 返 回 终止 状 
态 码 0， 因 而 显示 的 终止 状态 码 是 0 


该 脚本 的 最 后 一 条 命令 是 exit 10, 返 回 终止 状 
态 码 10， 因 而 显示 的 终止 状态 码 是 10 


gcc 命令 将 status4.c 编 译 成 可 执行 程序 status4， 
命令 status4 执行 该 程序 。 由 于 C 语言 的 库 函 
数 exit0 返 回 的 终止 状态 码 是 5， 因 此 echo $? 
命令 显示 终止 状态 码 5 


由 于 最 后 的 函数 调用 atoi0 的 返回 值 是 整数 
123( 字 符 串 “123 ”的 整数 值 )， 因 此 其 终止 状 
态 码 是 123 


有 ”思考 与 练习 题 22 在 当前 目录 下 输入 命令 “ls -1” 并 执行 的 输出 结果 如 下 : 


-IW-IW-I— 1 xugg xuqg 
-IW-IW-I— 1 xuqg xuqg 
drwxr-xr-x 4Iootroot 


114 Jul 15 19:07 test.sh 
110 Jul 15 18:46 semlib.c ~ 
4096 Feb 100:18 dirl 


请 问 下 列 命令 序列 中 echo $? 的 输出 结果 是 什么 ? (注意 : Linux Shell 允许 在 一 行 中 输入 多 个 命 


仿 


， 命 令 间 以 分 号 隔 开 。) 


(1) /dirl; echo $2: echo 3$? 
(2) cd; echo $2 

(3) .semlib.c: echo $?; Secho $7? 
(4) Jabcd: echo $7 


Shell 数学 运算 与 字符 串 处 理 


2.2.1 Shell 数学 运算 


一 般 编程 语言 都 应 提供 数学 运算 功能 ，bash 虽然 将 所 有 变量 值 看 成 字符 串 ， 不 便于 进行 数学 运 

算 ， 但 它 也 提供 了 两 种 实施 数学 运算 的 机 制 : 一 种 是 使 用 expr 命令 ， 格 式 为 expr expression; 另 一 
种 是 用 美元 符号 和 方 括号 把 数学 表达 式 括 起 来 ， 格 式 为 S[expression]。 由 于 expr 命令 比较 笨拙 ， 对 
表达 式 的 格式 限制 很 多 ， 而 方 括号 非常 灵活 ， 因 此 实际 应 用 中 更 多 使 用 第 二 种 机 制 。 请 看 以 下 示例 
arith.sh: 

#1/bin/bash 

varl=100 

Var2=45 


Var3=50 
var4=$[$varl* ($var2 - $var3)] 
echo The final result is $var4 


运行 此 脚本 将 生成 如 下 输出 : 


Schmod +x arith.sh 
$ /arith.sh 
The final result is -500 


2.2.2 Shell 字符 串 处 理 


C、Java、Python 等 高 级 语言 都 提供 了 丰富 的 库 函 数 ， 以 方便 应 用 开发 人 员 进 行 字符 串 处 理 。 
Bash Shell 本 身 没有 库 函 数 ， 对 字符 串 处 理 的 支持 主要 通过 expr、awk 等 命令 来 实现 。 这 两 个 命令 能 
够 实现 较为 丰富 的 字符 串 处 理 功能 ， 以 满足 应 用 编程 需要 。 表 2-3 中 展示 了 一 些 Shell 字符 串 处 理 方 
法 及 示例 。 


表 2-3 Shell 字符 串 处 理 方法 及 示例 


编程 方法 
expr substr 字符 串 开始 索引 长 度 


编程 示例 
str= expr substr "abc" 2 2 
结果 : str 的 值 为 bc 
str="abe" 

str2=${str:1} 

str3=$ {str:1:2} 

结果 : st2、str3 的 值 都 是 bc 


功能 
抽取 子 字符 串 


S${str:pos} 
S${str:pos:len} 
功能 : 在 字符 串 sf 中 ,抽取 从 位 置 pos 开始 、 长度 
为 len 的 子 串 
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( 续 表 ) 
功能 编程 方法 编程 示例 
计算 字符 串 的 长 度 ${##tring} str=acbdef 
expr length $string nl=S {#str} 
功能 : 计算 字符 串 string 的 长 度 02= expr length $str 
结果 : n1、n2 的 值 都 是 5 
计算 子 串 的 出 现 expr index $string substring str="hello.everyone" 
位 置 功能 : 在 字符 串 string 中 找 出 子 串 substring 第 一 次 | nl1= expr index "$str" my 
出 现 的 位 置 ， 若 找 不 到 ， 返 回 0 或 1 02= expr index "$str" ev” 
1n3= "expr index "$str" ev.*" 
结果 : nl 为 0，n2、m3 都 是 2 
返回 匹配 到 的 子 串 | exprmatch Sstring substring string="hello.everyonen 
的 长 度 功能 : 返回 string 从 头 开始 匹配 substring 的 子 串 的 | nl= exprmatch "$string" he 
长 度 ， 若 找 不 到 ， 返 回 0 D2 一 exprmatch "$string" he.#” 
结果 : nl 为 2，n2 为 14 
其 中 , * 是 正则 表达 式 通配符 , 表示 匹配 任 
何 子 串 
删除 字符 串 S{string#substring} str="20091111 readnow please" 
功能 : 删除 string 开头 处 与 substring 匹配 的 最 短 字 | str1=S$ {str#2*1} 
符 子 串 结果 : strl 为 111 readnow please 
删除 从 字符 2 开始 , 到 第 一 个 1 为 止 的 子 串 
S{string##substring} str="20091111 readnow please" 
功能 :删除 string 开头 处 与 substring 匹配 的 最 长 字 | str2=$ {st##2*1} 
符 子 串 结果 : str2 为 readnow please 


台 思考 与 练习 题 2.3 请 写 出 执行 下 面 脚本 后 的 输出 : 


#1/bin/bash 


string="hello.everyonemynameisxiaoming" 
echoecho $i{#string} 


expr index 
expr 


"Sstring" my 
match "$string" hell.* 


expr match "$string"hell 


echo 


S{string:10:5} 


expr substr"$string"10 5 


Shell 条 件 与 让 控制 结构 


删除 从 字符 2 开始 ， 到 最 后 一 个 1 为 止 的 
子 串 


bash 可 以 对 Shell 脚本 进行 流程 控制 ， 提 供 过、case 和 for 等 控制 结构 ， 使 Shell 具有 C、Java 


等 高 级 语言 的 流程 控制 能 


和 case 两 种 结构 化 命令 。 


， 这 些 控制 结构 具有 较 好 的 结构 化 特征 ， 称 为 结构 化 命令 。 本 节 介 绍 直 
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2.3.1 ji 语句 


让 语句 是 包括 汇编 语言 在 内 几乎 所 有 编程 语言 必须 提供 的 流程 控制 结构 。bash 的 站 语句 非常 直 
观 ， 其 格式 有 不 带 else 分 支 和 带 else 分 支 两 种 。 


不 带 else 分 支 的 站 语句 格式 : 带 else 分 支 的 站 语句 格式 : 
ifcommand fcommand 
then then 
commands commands 
fi else 
commands 
fi 


让 语句 的 含义 是 ， 如果 下 行 的 命令 执行 成 功 ( 即 终止 状态 码 为 0)， 则 执行 then 分 支 的 语句 序列 ， 
否则 执行 else 分 支 的 语句 序列 。 下 面 给 出 几 个 实例 。 
示例 2-1: condiflsh 
#1/bin/bash 


# testing the if statement 
ifdate 


脚本 执行 结果 如 下 : 
S$ /condifl.sh 
Sat Sep 29 14 : 09:24 EDT 2007 
it worked 
因为 date 命令 总 能 成 功 执行 ， 所 以 脚本 会 执行 then 分 支 的 命令 序列 。 
示例 2-2: condiP .sh 
#1/bin/bash 
#testing a bad command 
ifasdfg 


then 
echo "it didn't work" 
ff 
echo "we ' re outside of the if statement" 


脚本 执行 结果 如 下 : 


S$ /condif12.sh 

. /test? : line 3: asdfg: command not found 

were outside of the if statement 

在 本 例 中 , 在 直行 放 了 一 条 错误 的 命令 , 它 会 产生 一 个 非 零 的 终止 状态 码 ，Bash Shell 跳 过 then 
部 分 的 echo 语句 ， 直 接 执 行 后 面 的 命令 。 需 要 注意 的 是 : 运行 让 语句 中 的 命令 所 产生 的 错误 信息 
仍然 出 现在 脚本 的 输出 结果 中 。 
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示例 2-3: condif3.sh 


1 #1/bin/bash 

2 #testing multiple commands in the then section 

3 testuser=can 

4 ifgrep S$testuser /etc/passwd 

5 then 

6 echo The bash files for user $testuser are : 

1s -a /home/$testuser/.b* 

8 else 

9 echo "The user name S$testuser doesn ' t exist on this system" 
10 fi 


该 脚本 的 让 语句 行使 用 grep 命令 搜索 /etc/passwd 文件 ， 查 看 系统 是 否 正 在 使 用 某 个 特定 的 用 
户 名 。 如 果 一 个 用 户 拥有 该 登录 名 ， 脚 本 会 显示 一 些 文本 ， 然 后 列 出 用 户 家 目录 下 的 bash 文件 。 
执行 结果 如 下 : 

§$ /condif3.sh 

Tich : x : 500 : 500 :Rich Bl um: /home/rich : /bin/bash 

The files for u ser rich are : 

/home/rich/.bash_history Ihome/r ich/ . bash_profile 

/home/rich/ .bash_logout /home/rich/ . bashrc 


有 时 需要 在 脚本 代码 中 检查 几 种 情况 。 这 时 可 以 不 必 编 写 单独 的 还 then 语句 ， 可 以 使 用 else 
部 分 的 另 一 种 版 本 ， 称 为 elif。elif 以 另 一 个 正 then 语句 继续 else 部 分 : 


if command1 
then 

commands 
elif command2 
then 

more commands 
ff 


还 可 以 把 多 个 elif 语句 串 在 一 起 ， 创 建 一 个 大 的 寺 then-elif 组 : 


fcommandl 
then 

command set 1 
elif command2 
then 

command set 2 
elif command3 
then 

command set 3 


command set 4 
ff 


bash 会 按 顺 序 执行 让 语句 ， 只 有 第 一 个 返回 0 终止 状态 码 的 命令 会 导致 其 then 部 分 的 命令 被 
执行 。 


2.3.2 test 命令 


前 面 给 出 的 站 语句 行 都 以 普通 的 Shell 命令 作为 评判 条 件 。 但 在 实际 应 用 中 ，bash 还 需要 具有 
通常 意义 上 的 条 件 检测 能 力 ， 比 如 数值 比较 、 文 件 属性 检查 、 字 符 串 比较 等 。Linux Shell 提供 了 test 
命令 来 实现 这 些 功 能 。 若 test 命令 算出 的 条 件 值 为 tue， 则 test 命令 将 其 终止 状态 码 设置 为 0， 芷 
语句 执行 其 then 分 支 ; 若 算出 的 条 件 值 为 lse， 则 test 命令 将 其 终止 状态 码 设置 为 非 零 ， 执 行 站 语 
句 的 else 分 支 。 

test 命令 的 格式 非常 简单 : 


test condition 


其 中 ，condition 是 一 系列 test 命令 求 值 的 条 件 表达 式 。 在 正 then 语句 中 使 用 时 ，test 命令 如 下 
所 示 : 

让 test condition 

then 


commands 
ff 


Bash Shell 提供 了 在 让 then 语句 中 声明 test 命令 的 另 一 种 方法 : 
人 
then 
commands 
方 括号 定义 在 test 命令 中 使 用 的 条 件 。 注意: 在 前 半 个 方 括号 的 后 面 和 后 半 个 方 括号 的 前 面 必 
须 都 有 一 个 空格 ， 否 则 会 得 到 错误 信息 。test 命令 能 够 评估 以 下 条 件 : 数值 比较 、 字 符 串 比较 、 文 
件 比较 。 


1. 数值 比较 
使 用 test 命令 的 最 常用 方法 是 比较 两 个 数值 ， 表 2-4 显示 了 用 于 测试 两 个 值 的 条 件 参 数列 表 。 
表 2-4 test 命令 数值 比较 


比较 描述 
nl -eqn2 检查 nl 是 否 等 于 n2 nl -len2 检查 nl 是 否 小 于 或 等 于 n2 
nl -gen2 检查 nl 是 否 大 于 或 等 于 n2 nl -ltn2 检查 nl 是 否 小 于 n2 
nl -gtn2 检查 nl 是 否 大 于 n2 nl -ne n2 检查 nl 是 否 不 等 于 n2 


数值 测试 条 件 能 用 于 估计 数字 和 变量 ， 脚 本 cmpnumsh 是 一 个 例子 : 


#1/bin/bash 
#using numeric test comparisons 
vall=10 
val2=11 
if[ $vall -gt 5] 
then 
echo "The test value $vall is greater than 5" 
下 
if[ $vall -eq $val2] 


ooo- 
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第 一 个 站 语句 “并 [ $vall -gt 5 ]” 测 试 变 量 vall 的 值 是 否 大 于 5， 第 二 个 让 语句 “if[ $vall -eq 
$val2 ] ”测试 变量 vall 的 值 是 否 等 于 变量 val2 的 值 。 运 行 该 脚本 并 查看 结果 : 


§$. /cmpnum.sh 
The test value 10 is greater than 5 
The values are different 


这 两 个 数值 测试 条 件 都 像 预期 的 那样 被 评估 。 
2. 字符 串 比较 
test 命令 允许 对 字符 串 值 进 行 比较 。 进 行 字符 串 的 比较 稍微 复杂 一 些 ， 表 2-5 列 出 了 常用 的 字 
符 串 值 比较 表达 式 。 
表 2-5 test 命令 字符 串 比较 


比较 描述 
sl = shi? 检查 str 是 否 大 于 st2 
strl = sh? i 检查 strl 的 长 度 是 否 大 于 0 
stl <st2 检查 sl 的 长 度 是 否 为 0 


示例 脚本 cmpstr.sh 对 字符 串 的 长 度 进行 测试 : 


1  #/bin/bash 

2 #testlng string ] ength 

3 vall=testing 

4 val2=" 

5 if[-n$vall] 

6 then 

7 echo"The string '$vall 1snotempty" 
8 else 

| echo "The string '$vall is empty" 

10 ff 


12 if[-zS$val2] 

13 then 

14 echo"The string $val2' 1s notempty" 
15 else 

16 echo"The string '$val2' is empty” 
7 


运行 结果 如 下 : 
S$ /cmpstr.sh 


The string ‘testing' is not empty 
The string " is empty 


这 个 例子 创建 了 两 个 字符 串 变 量 : 变量 vall 包含 一 个 字符 串 ， 变 量 val2 作为 空 字符 串 创建 。 
测试 结果 是 vall 的 长 度 不 为 0，val2 的 长 度 为 0。 


3. 文件 比较 


文件 属性 测试 是 经 常 需要 用 到 的 功能 ,test 命令 能 够 测试 Linux 文件 系统 中 的 文件 状态 和 路 径 。 
表 2-6 列 出 了 这 些 比 较 和 测试 功能 的 格式 。 


表 2-6 test 命令 文件 比较 


比较 描述 
-dfile 检查 file 是 否 存在 并 且 是 一 个 目录 
-efile 检查 fle 是 否 存在 
-ffile 检查 file 是 否 存在 并 且 是 一 个 文件 
-file 检查 file 是 否 存 在 并 且 可 读 
-sfile 检查 file 是 否 存在 并 且 不 为 空 
-w file 检查 fle 是 否 存 在 并 且 可 写 
-xfile 检查 fle 是 否 存 在 并 且 可 执行 
-Ofile 检查 fle 是 否 存 在 并 且 被 当前 用 户 拥 有 
-G file 检查 fle 是 否 存 在 并 且 默 认 值 为 当前 用 户 组 
filel-nt file2 检查 flel 是 否 比 fle2 新 
filel-0z file2 检查 flel 是 否 比 fle2 旧 


这 些 条 件 允 许 在 Shell 脚本 中 检查 文件 系统 中 的 文件 ， 经 常用 于 访问 文件 的 脚本 。 下 面 以 检查 
文件 是 否 存 在 和 是 否 执 行 来 说 明文 件 属性 测试 命令 的 使 用 方法 。 

(1) 检查 对 象 是 否 存在 

在 脚本 中 使 用 文件 或 目录 之 前 ，-e 选项 能 检查 它们 是 否 存在 。 如 果 要 确定 指定 的 对 象 是 否 为 文 
件 ， 可 使 用 -f 选 项 。cmpfilel.sh 是 一 个 示例 : 


1  #/bin/bash 

2  #check ifafile 

3 if[-e$HOME] 

4 then 

5 echo "The object SHOME exists .is it a file?" 
6 if[-$HOME] 

7 then 

8 echo"yYes.it'safile!" 

时 else 

10 ”echo "No,$HOME isnotafile!" 

11 fi 

12 if[-f$HOME/bash history ] 

13 then 

14 echo "But $SHOME/.bash history isa file!" 
上 请 

16 else 

17 。 echo "Sory. the object doesn't exist" 
I 
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该 脚本 的 运行 结果 如 下 : 

$ /empfilel.sh 

The object ... exists, is ita file? 

NO, ... isnota file! 

But .../bash history is a file! 

在 该 脚本 中 ， 系 统 变 量 8HOME 是 当前 用 户 的 “家 ”目录 ， 程 序 执行 实际 显示 的 “...” 是 用 户 
登录 主 目录 。 这 个 小 脚本 使 用 -e 来 检查 SHOME 是 否 存 在 ， 如 果 存 在 ,就 使 用 -f 检查 它 是 否 为 文件 。 
如 果 不 是 文件 (当然 不 是 文件 )， 使 用 -f 比较 检查 $SHOME/ bash-history 是 否 为 文件 ， 它 确实 是 文件 。 

(2) 检查 文件 是 否 能 够 运行 

使 用 -x 选项 是 确定 是 否 拥 有 指定 文件 的 运行 权限 的 一 种 简单 方法 ， 如 果 从 Shell 脚本 中 运行 很 
多 脚本 ， 这 项 测试 就 会 很 方便 。cmpfile2.sh 是 一 个 示例 : 

#1/bin/bash 
#testing file execution 
if[ -x cmpfilel.sh ] 
then 


echo "You can run the script:" 

/cmpfilel.sh 

else 

echo "Sorry, you are unable to execute the script" 
fi 


该 脚本 的 运行 结果 如 下 : 


$ /cmpfile2.sh 
You can run the script : 


该 Shell 脚本 示例 使 用 -x 选项 来 检查 是 否 有 执行 脚本 cmpfilel.sh 的 权限 ， 如 果 有 权限 ， 就 会 运 
行 该 脚本 。 


*2.3.3 ”复合 条 件 检查 
自 then 语句 可 以 使 用 布尔 逻辑 来 合并 检查 条 件 ， 可 以 使 用 两 个 布尔 操作 符 : 


… [ conditionl ] && [ condition2 ] 

.[ conditionl ] | [ condition2 ] 

用 第 一 个 布尔 操作 && 合 并 的 两 个 条 件 都 满足 时 才 执 行 then 部 分 ; 用 第 二 个 布尔 操作 || 合 并 的 两 
个 条 件 ， 只 要 任何 一 个 条 件 的 计算 结果 为 ue， 就 会 执行 then 部 分 。cmpand sh 是 一 个 示例 脚本 : 


1  #/bin/bash 

六 #testing compound comparisons 

3 if[-d$HOME ]&&[-wSHOME:testing] 
4 then 

= echo "The file exists and you can write to it 
6 else 

7 echo"l can'twriteto the file" 

8 


下 


以 下 是 该 脚本 的 运行 结果 : 
S$ /cmpand.sh 

I can' t write to the file 

Stounch S$SHOME:/esting 

S$ /cmpand.sh 

The file exists and you can write to it 


第 一 个 比较 检查 用 户 的 家 目录 是 否 存 在 ;第 二 个 比较 检查 用 户 的 根 目录 下 是 否 有 testing 文件 ， 
以 及 用 户 是 否 对 该 文件 有 写 权 限 。 任 意 一 个 比较 失败 ，if 条 件 就 为 false，Shell 执行 else 部 分 ;如 
果 这 两 个 比较 都 成 功 ， 直 条件 为 mue，Shell 执行 then 部 分 。 


2.3.4 ”case 语句 


case 语句 也 是 一 种 常用 的 控制 结构 ，bash 的 case 结构 比 C 语言 的 case 结构 更 加 灵活 ， 使 用 更 
加 方便 。case 命令 以 列表 导向 格式 检查 单个 变量 的 多 个 值 : 


case variable in 
patteml | pattern?2) commandsl:: 
pattem3) commands2:: 
*) default commands:: 

esac 


case 命令 对 指定 的 变量 与 不 同 的 模式 进行 比较 。 如 果 变 量 与 模式 匹配 ，Shell 执行 为 该 模式 指定 
的 命令 。 可 以 在 一 行 中 列 出 多 个 模式 ， 使 用 竖 条 操作 符 将 每 个 模式 分 开 。 星 号 代表 与 任何 列 出 的 模 
式 都 不 匹配 的 所 有 值 。condcase.sh 是 一 个 使 用 case 命令 转换 正 then-else 程序 的 示例 : 


1  #/bin/bash 

2 # using the case command 

3 USER=rich 

4 case$USERin 

5 rich|barbara) 

6 echo "Welcome, SUSER" 

7 echo "Please enjoy your visit";; 

8 testing) 

9 echo"Specialtestingaccount";: 

10 essica) 

11 echo "Don'tforgetto log off when you're done":; 
12 +) 

13 echo "Sorry, you're notallowed here":: 
14 esac 


以 下 是 该 脚本 的 运行 结果 : 
$ /condcase.sh 


Welcome. rich 
Please enjoy your visit 


循环 结构 


循环 控制 也 是 Shell 脚本 流 的 一 些 结构 化 命令 ， 能 将 过 程 和 命令 通过 一 组 命令 循环 ， 直 到 满足 
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某 个 特定 条 件 ，Bash Shell 循环 命令 有 for、while 和 until。 


2.4.1 for 循环 结构 


bash 提供 的 for 命令 用 于 创建 基于 列表 的 循环 ， 循 环 变量 依次 取 列表 中 的 每 个 值 ， 然 后 执行 循 
环 体 。for 命令 的 基本 格式 为 : 

forvarin list 

do 


commands 
done 


参数 list 提供 一 系列 用 于 夫 代 的 值 。 在 每 次 迭代 中 ， 变量 var 包含 列表 的 当前 值 。 第 一 次 迭代 
使 用 列表 中 的 第 一 项 ， 第 二 次 迭代 使 用 第 二 项 ， 依 此 类 推 ， 直 到 列表 中 的 所 有 项 都 被 使 用 为 止 。 
do 和 done 之 间 的 命令 序列 是 for 循环 体 ， 这 些 命令 可 以 用 $var 引用 变量 var 的 值 ， 即 当前 迭代 的 列 
表 项 值 。 

在 列表 中 指定 值 有 几 种 不 同 的 方法 。 


1. 读 取 列表 或 变量 中 的 值 


for 命令 的 基本 使 用 方法 是 直接 给 出 值 列表 ，loopforl.sh 是 一 个 示例 : 
#1/bin/bash 
#basic for command 
for test in Alabama Alaska Arizona "New Mexico" 


do 
echo The next state is Stest 
done 

以 下 是 该 脚本 的 运行 结果 : 


$ /oopforl.sh 

The next state is Alabama 

The next state is Alaska 

The next state 1s Arizona 

The next state is New Mexico 

每 次 循环 友人 代 都 将 列表 中 的 下 一 个 值 赋值 给 变量 test。 循 环 结束 时 ， 变 量 $test 保持 最 后 一 次 和 兴 
代 的 列表 项 值 。 列 表 中 的 值 以 空格 隔 开 ， 若 某 个 值 的 中 间 包 含 空格 ， 则 必须 使 用 双 引 号 括 起 。 


2. 读 取 命 令 结果 中 的 值 


for 命令 的 第 二 种 使 用 方法 是 通过 运行 命令 产生 列表 , 命令 要 用 反 引 号 括 起 来 ，loopfor2.sh 是 一 
个 示例 : 


1  #/bin/bash 

2  #eading values froma file 
总 file="states" 

4 for state in ‘cat $file 

5 do 


6 echo "Visitbeautiful $state" 
7 done 


该 例 使 用 cat 命令 列 出 目录 states 的 内 容 作 为 列表 ， 复 制 给 循环 控制 变量 state。 
3. 使 用 通配符 读 取 目录 


for 命令 还 可 自动 从 文件 目录 读 取 文件 名 作为 列表 ， 一 般 需 要 在 文件 或 路 径 名 中 使 用 通配符 ， 
loopfor3.sh 是 一 个 示例 : 


1  #/bin/bash 

2 # iterate through all the files in a directory 
3 forfilein/home/can/work/* 
4 do 

5 if[-d "$file" ] 
6 then 

7 echo "S$file is a directory" 
8 elif[-f"$file"] 

9 then 

0 echo fileisafile" 

1 ff 

12 done 


以 下 是 该 脚本 的 运行 结果 : 


$ /oopfor3.sh 
/home/can/work/chap3 is a directory 


史 ”思考 与 练习 题 24 ls -F 命令 的 输出 如 下 : 
本 


请 编写 Shell 程序 ， 将 子 目录 lib 下 的 libwrapperh 和 wrapperh 两 个 文件 复制 到 chap3~chap9 这 
7 个 目录 中 。 


2.4.2 ”while 循环 结构 


while 命令 有 点 像 下 then 语句 和 for 循环 的 结合 。while 命令 允许 定义 要 测试 的 命令 ， 然 后 只 要 
定义 的 测试 命令 返回 终止 状态 码 0， 就 循环 执行 一 组 命令 。 它 在 每 次 迭代 开始 时 检查 测试 命令 。 测 
试 命令 返回 非 0 的 终止 状态 码 时 ，while 命令 停止 执行 命令 集 。while 命令 的 格式 是 : 

while test command 

do 

other commands 

done 

while 命令 的 关键 在 于 ， 指 定 的 test 命令 的 终止 状态 必须 根据 循环 中 命令 的 运行 情况 而 加 以 改 
变 。 如 果 终止 状态 总 是 为 0，while 循环 就 会 陷入 无 限 循环 中 。loopwhilel.sh 是 一 个 脚本 示例 ， 它 利 
用 一 个 while 循环 对 一 个 值 为 整数 的 变量 做 递减 运算 ， 并 显示 运算 结果 : 
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1 者 /binbash 

2  #whilecommand test 
= VarF=10 

4 while[S$varl -gt 0] 
lp 

6 echoSvarl 

7 varl=$[ Svarl-1] 

8 _ done 

以 下 是 该 脚本 的 运行 情况 : 
S$ /oopwhilel.sh 

10 

2] 

8 


该 例 使 用 Shell 算术 将 变量 值 减 1: 

varl=$[ $varl -1] 

当 测 试 条 件 不 再 为 tue 时 ，while 循环 停止 。 
2.4.3 “until 循环 结构 

until 命令 刚好 与 while 命令 相反 ， 当 测试 命令 产生 非 0 的 终止 状态 时 ， 循 环 就 继续 ， 直 到 测试 
命令 的 终止 状态 码 0。until 命令 的 格式 是 : 

until test commands 

do 


other commands 
done 


loopuntil.sh 是 一 个 使 用 unti 命令 的 示例 脚本 ， 它 利用 一 个 until 循环 对 一 个 值 为 整数 的 变量 做 
递减 运算 ， 并 显示 运算 结果 : 


#1/bin/bash 

宙 #using the until command 
3 varl=100 

4 until[S$varl -eq0] 

5 do 

6 echoSvarl 

7 varl=$[ S$varl -25] 

8 done 

以 下 是 该 脚本 的 运行 结果 : 
$ /oopuntilsh 

100 

75 


这 个 例子 测试 变量 varl 以 决定 until 循环 何 时 停止 ， 一 旦 变量 的 值 等 于 0，until 命令 就 停止 
循环 。 
旨 ” 思 考 与 练习 题 2.5 编写 Shell 脚本 ， 计 算 100 以 内 所 有 偶数 的 和 ， 并 打印 输出 。 


Linux 全 局 变量 和 环境 变量 


2.5.1 Linux Shell 层次 结构 


前 面 讨 论 过 ， 执 行当 前 目录 下 脚本 程序 script.sh 的 方法 通常 有 两 种 : .scriptsh 和 bash scriptsh， 
它们 完全 等 价 。 执 行 scriptsh 实际 上 是 执行 命令 bash，scriptsh 实际 上 是 命令 bash 的 数据 文件 ， 由 
bash 解释 并 执行 script.sh 中 的 每 条 命令 。 当 我 们 打开 一 个 Terminal 终端 时 ， 就 启动 了 一 个 bash， 在 
终端 输入 的 命令 由 该 bash 解释 执行 。 当 我 们 在 终端 执行 命令 bash 或 bash scriptsh 时 ， 又 会 启动 另 
一 个 bash。 这 些 bash 之 间 是 何 关系 ， 对 其 解释 执行 的 Shell 脚本 有 何 影响 ， 这 些 是 本 节 将 要 讨论 的 
内 容 。 

在 Linux 系统 中 ， 若 在 bashA 环境 下 启动 了 bashB， 则 称 bashA 是 父 Shell、bashB 是 子 Shell。 
如 果 按 不 同方 式 启动 多 个 bash 或 Shell 脚本 ， 则 会 形成 一 种 比较 复杂 的 Shell 层次 结构 。 

下 面 举例 说 明 这 种 概念 。 假 定 我 们 创建 了 一 个 Shell 脚本 scope.sh， 它 仅 有 一 条 语句 : 


#1/bin/bash 

现在 ， 在 当前 终端 执行 以 下 命令 序列 : 
$ bash .scope sh 命令 

$bash 命令 @ 

$ ./scope.sh 命令 @ 

S exit 命令 @ 

$. .scope.sh 命令 @ 


上 述 过 程 总 共 创建 4 个 Shell， 如 图 2-1 所 示 。 


can@ubuntu:~$ bash ./scope.sh 
can@ubuntu:~$ bash 
can@ubuntu:~$ ./scope.sh 
can@ubuntu:~$ exit 

exit 

can@ubuntu:~$ . ./scope.sh 
can@ubuntu:~$ 


图 2-1 创建 的 4 个 Shell 


首先 ， 终 端 窗口 本 身 是 一 个 bash， 我 们 记 为 bashA。 

执行 命令 GDbash ./scope.sh 时 ,bashA 会 创建 一 个 新 的 Shell 来 解释 执行 脚本 scope.sh, 将 这 个 bash 
记 为 bashB， 脚 本 完成 ，bashB 退出 。 

执行 命令 @bash 时 ，bashA 启动 一 个 新 的 Shell， 记 为 bashC， 现 在 终端 命令 由 bashC 解释 执行 。 

启动 命令 @)./scope.sh，bashC 又 创建 一 个 新 的 Shell， 以 解释 执行 该 脚本 ， 记 为 bashD， 脚 本 完 
成 ，bashD 退出 。 
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执行 命令 @exit， 退 出 bashC， 现 在 ， 终 端 命令 重新 由 BashA 解释 执行 。 


执行 命令 @@. ./scope.sh， 在 脚本 启动 命令 前 增加 “.”， 表 示 不 创建 新 的 Shell， 而 是 由 命令 窗 
的 bashA 解释 执行 该 脚本 ， 命 令 @ 的 另 一 种 等 效 启动 方式 是 “source ./scope.sh”。 

综 上 所 述 , 以 上 4 个 Shell 的 父子 关系 如 图 2-2 所 示 , 终端 对 应 的 bashA 是 bashB 和 bashC 的 父 
Shell，bashC 又 是 bashD 的 父 Shell。Shell 之 间 的 父子 关系 与 Linux Shell 的 全 局 变量 、 环 境 变量 概 


Cbasha _) 
CD CE 


2-2 4 个 Bash Shell 间 的 父子 关系 


2.5.2 ”Shell 全 局 变量 与 局 部 变量 


Bash Shell 中 有 两 种 类 型 的 变量 : 全 局 变量 与 局 部 变量 。 全 局 变量 是 在 所 有 子 Shell 中 都 可 见 的 
Shell 变量 ， 而 局 部 变量 是 仅 在 创建 它 的 Shell 中 可 见 的 变量 。 局 部 变量 是 通过 直接 给 变量 赋值 而 创 
建 的 Shell 变量 ， 而 全 局 变量 则 是 用 export 命令 处 理 过 的 局 部 变量 。 例 如 ， 以 下 脚本 就 创建 了 局 部 
变量 varl 和 两 个 全 局 变量 var2、var3: 


varl=local 
export var2="global var2" 
Wi Var3" 
export Var3 
下 面 用 一 个 示例 来 说 明 全 局 变量 和 局 部 变量 的 特征 。 假 设 脚本 文件 scope2.sh 的 内 容 是 : 
1  #/bin/bash 
2 echo S$varl 
3 echo S$var2 
以 下 是 在 终端 执行 的 命令 序列 : 
1 $ varl=local 
沁 $ export var2="giobal var2" 
季 $ bash ./scope2.sh 
4 $bash 
5 $ ./scope.sh 
6 S$ exit 
7 S$. /scope.sh 或 $source /scopesh 


不 难 获知 ， 这 个 命令 序列 创建 图 2-2 所 示 父 子 关系 的 4 个 Shell， 我 们 仍 以 该 图 定义 的 符号 来 记 
录 这 4 个 Shell。 

@ 首先 ， 第 1 行 与 第 2 行 分 别 创建 bashA 的 局 部 变量 varl 和 全 局 变量 var2。 

加 执行 第 3 行 命令 的 bashB 是 bashA 的 子 Shell， 它 只 能 看 见 bashA 的 全 局 变量 var2， 而 看 不 
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见 局 部 变量 varl。 因 此 ， 在 脚本 scope.sh 看 来 ，var2 的 值 为 global var2，varl 无 定义 ， 因 此 输出 为 
global var2 。 

@ 执行 第 5 行 命令 的 bashD 是 bashC 的 子 Shell， 而 bashC 是 bashA 的 子 Shell，bashA 的 全 局 
变量 会 经 由 bashC 传 给 bashD。 因 此 ， 这 时 在 脚本 scope.sh 看 来 ，var2 可 见 ，varl 不 可 见 ， 命 令 输 
出 也 是 global var2。 

@ 第 7 行 命令 由 bashA 执行 ，scope.sh 脚本 可 视 为 直接 在 终端 窗口 中 执行 ，scope.sh 可 同时 看 
到 变量 varl 和 var2 的 值 ， 命 令 输出 有 两 行 : local 和 global var2。 

旨 ” 思考 与 练习 题 2.6 在 上 述 脚 本 中 ， 将 第 1 行 命令 改 为 “export varl=local”， 将 第 2 行 命令 改 
为 “var2= global var2”， 请 问 第 3、5、7 行 命令 的 输出 结果 是 什么 ? 


2.5.3 ”Linux 环境 变量 


在 Linux 系统 中 , 包括 Shell 脚本 在 内 的 应 用 程序 、 系 统 程序 经 常 需 要 获取 系统 配置 信息 、 用 户 
身份 信息 、 运 行 环境 信息 。Linux 系统 将 这 些 信 息 保 存在 一 组 环境 变量 中 ， 供 应 用 程序 、 系 统 程 序 
读 取 。Linux 环境 变量 是 用 来 保存 系统 配置 信息 、 用 户 身份 信息 、 运 行 环境 信息 的 全 局 Shell 变量 。 
虽然 Linux 环境 变量 一 般 都 是 全 局 Shell 变量 ， 但 由 系统 定义 的 环境 变量 通常 用 大 写 英文 单词 命名 ， 
而 用 户 自 定义 的 全 局 变量 则 用 小 写 英文 单词 命名 。 在 应 用 中 ， 我 们 经 常 也 将 用 户 自 定 义 的 全 局 变量 
称 为 环境 变量 。 

系统 环境 变量 实际 上 是 在 Linux 系统 启动 用户 登 录 、 创建 Shell 会 话 (打开 命令 窗口 ) 的 过 程 中 ， 
执行 特定 初始 化 脚本 创建 的 全 局 变量 。 在 Linux 和 Windows 下 ，Java、Android、 大 数据 等 开发 平台 
都 普遍 使 用 环境 变量 来 设置 开发 环境 和 运行 环境 。 使 用 C/C++、Java、Perl、Python 等 语言 编写 的 程 
序 都 提供 了 相应 的 设施 来 访问 系统 环境 变量 。 

表 2-7 列 出 了 Linux 常用 的 环境 变量 的 名 称 和 描述 。 


表 2-7 Linux 常用 的 环境 变量 的 名 称 和 描述 


变量 描述 
PATH 冒号 隔 开 的 目录 列表 ，Shell 将 在 这 些 目 录 中 查找 命令 
LD_LIBRARY PATH 程序 运行 过 程 中 查找 第 三 方 动态 库 的 目录 路 径 ， 以 冒号 隔 开 多 个 目录 
C_INCLUDE PATH C 程序 编译 过 程 中 查找 第 三 方 头 文件 的 目录 路 径 ， 以 冒号 隔 开 多 个 目录 
CPLUS_INCLUDE PATH C++ 程序 编译 过 程 中 查找 第 三 方 头 文件 的 目录 路 径 ， 以 冒号 隔 开 多 个 目录 
JAVA_HOME Java 开发 环境 所 在 目录 
UD 当前 用 户 刀 
HOME 当前 用 户 的 主 目录 
USER 当前 用 户 名 
SHELL 当前 Shell 类 型 
PWD 当前 工作 目录 
既然 环境 变量 也 是 Shell 变量 ， 就 可 用 命令 echo 或 赋值 语句 读 取 变量 值 ， 例 如 : 
Secho SHOME 


/home/can 
此 外 ，Linux 还 提供 了 env、printenv 等 命令 ， 可 查看 所 有 环境 变量 的 值 : 
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Sem 
XDG VTINR=7 
XDG SESSION ID=c2 


在 系统 管理 和 应 用 开发 中 ， 常 用 的 Linux 环境 变量 有 以 下 几 个 。 
1. 命令 搜索 路 径 环 境 变量 PATH 


PATH 环境 变量 定义 了 Linux 系统 的 命令 搜索 目录 列表 。 当 我 们 在 终端 窗口 中 输入 一 个 命令 时 ， 
bash 就 会 依次 搜索 PATH 环境 变量 中 的 每 个 目录 。 如 果 找 到 一 个 以 命令 串 为 文件 名 的 可 执行 文件 ， 
bash 就 加 载 执行 该 文件 ， 如 果 所 有 目录 都 不 包含 命令 文件 ，bash 就 显示 “command not found”( 命 
令 未 找到 ) 错 误 ， 并 设置 终止 状态 码 为 127。 

假设 当前 目录 下 有 前 面 创建 的 Shell 脚本 程序 arith.sh， 已 为 其 添加 执行 权限 。 在 该 脚本 所 在 目 
录 ， 以 文件 完整 路 径 “Jarithl.sh” 为 命令 串 ， 可 成 功 启动 该 程序 。 但 如 果 命令 串 仅 给 出 文件 名 ， 则 
命令 启动 失败 ， 显 示 “command not found” 错 误 。 


S$ arith.sh 
examl.sh: command not found 


为 了 探究 个 中 原因 ， 我 们 查看 环境 变量 PATH 保存 的 命令 搜索 目录 列表 是 什么 : 

Secho S$PATH 

/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/root/nachos/bin 

当 我 们 输入 命令 arith.sh 时 ，bash 将 到 包括 /usr/local/sbin、/usr/localbin、/usr/bin 在 内 的 八 个 目 
录 中 查找 文件 arith sh， 但 arith sh 所 在 当前 目录 (假定 为 home/can) 不 在 命令 所 示 路 径 集 合 中 ， 所 以 
bash 因 找 不 到 命令 文件 而 无 法 执行 命令 ， 显 示 命 令 未 找到 错误 。 

但 如 果 我 们 将 文件 arith.sh 所 在 的 目录 路 径 “.” 添 加 到 PATH 环境 变量 的 路 径 列 表 中 : 

Sexport PATH=$PATH:. 

再 直接 输入 文件 名 ， 就 能 执行 该 命令 了 : 


S$ arith.sh 
The final result is -500 


将 “.” 添 加 到 了 PATH 环境 变量 的 目录 列表 中 ，bash 找到 位 于 当前 目录 的 命令 文件 。 若 希望 在 切 
换 到 其 他 目录 下 之 后 ， 还 能 直接 执行 位 于 家 目录 (假设 为 home/can) 的 命令 文件 ， 则 应 将 目录 
Chome/can) 添 加 到 PATH 环境 变量 的 路 径 列 表 中 。 


2. 开发 工具 安装 位 置 环 境 变量 


Linux 系统 下 的 很 多 开发 工具 ,如 Java、Spark、Tomcat、Hadoop 等 ， 当 把 它们 安装 到 系统 中 时 ， 
安装 程序 通常 会 为 每 种 工具 创建 一 个 环境 变量 ， 保 存 它们 的 安装 位 置 ， 一 般 取 名 为 “大 写 的 工具 名 
称 HOME”, 如 JAVA HOME、SPARK HOME、TOMCAT HOME、HADOOP HOME 等 。 这 些 
软件 本 身 会 携带 一 系列 操作 命令 ， 一 般 放 在 其 子 目 录 bin 中 。 因 此 ， 为 了 方便 运行 这 些 命令 ,一 般 
应 该 手工 或 自动 将 相应 的 bin 目录 添加 到 环境 变量 PATH 的 目录 列表 中 。 比 如 ， 安 装 Hadoop 后 ， 
就 应 该 将 SHADOOP_HOME/bin 添加 到 了 PATH 中 : 
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Sewort PATH=S$PATH:S$SHADOOP/bin 

采用 命令 行 方法 添加 开发 工具 命令 目录 后 ， 只 有 该 窗口 能 直接 运行 开发 工具 命令 ， 而 且 每 次 打 
开 新 的 窗口 时 ， 都 必须 重新 设置 PATH 环境 变量 。 如 果 和 希望 每 次 开机 后 系统 自动 设置 好 PATH 路 径 
列表 ， 则 应 将 设置 PATH 路 径 的 命令 放 到 初始 化 脚本 文件 中 。 系 统 初始 化 脚本 有 多 个 ， 在 Ubuntu 
中 ，/etc/profile 是 系统 初始 化 脚本 ， 放 在 该 文件 中 的 设置 对 所 有 用 户 生 效 ; SHOME/profile 是 用 户 登 
录 初 始 化 脚本 ， 放 在 该 文件 中 的 设置 对 所 有 新 打开 的 终端 窗口 和 应 用 程序 生效 ， 而 SHOME/bash rc 
是 终端 窗口 初始 化 脚本 ， 放 在 该 文件 中 的 设置 仅 对 当前 窗口 初始 化 有 效 。 


*3. C/C++ 应 用 开发 与 运行 相关 环境 变量 


C/C++ 应 用 开发 与 运行 相关 环境 变量 有 三 个 : LD LIBRARY PATH、C _INCLUDE PATH、 
CPP_INCLUDE PATH。 其 中 ，LD_ LIBRARY PATH 变量 保存 应 用 程序 运行 时 搜索 到 的 自 定义 或 
第 三 方 共享 库 (动态 库 ) 路 径 列 表 ; C_INCLUDE PATH 变量 保存 第 三 方 C 语言 库 函数 API 的 头 文件 
目录 列表 ， 作 为 gcc 默认 查找 的 头 文件 目录 ; CPP_INCLUDE PATH 变量 保存 第 三 方 CH+ 库 函数 
API 的 头 文件 目录 列表 ， 作 为 g++ 默认 查找 的 头 文件 目录 。 


*2.5.4 ”Shell 变量 的 删除 和 只 读 设置 方法 


赋值 后 的 Linux 变量 需要 占用 内 存 ， 如 果 能 确定 以 后 不 再 使 用 ， 则 可 用 命令 unset 删除 它 。 局 部 
变量 和 全 局 变量 都 可 用 unset 命令 删除 。 例 如 : 

S$ var1=123456 

$echo varl 

123456 

S$ unset var1 

Secho S$varl 

$ 

Shell 变量 一 般 都 是 可 读 写 的 ， 但 可 用 内 置 命令 readonly 或 declare -r 给 变量 设置 只 读 属 性 ， 定 
义 只 读 变量 。 定 义 为 只 读 之 后 ， 变 量 不 允许 再 被 赋值 : 

S$ readonly x=9 

$x=10 

bash:x:readonly variable # 不 能 再 给 只 读 变 量 x 赋 值 

Sdeclare—r y="wearefriends™ 

Sunset y 

‘bash: unset: x: cannot unset: readonly variable 


2.5.5 ”Shell 数组 的 定义 和 使 用 方法 

bash 可 定义 一 维 数组 (不 支持 多 维 数组 )， 数 组 元 素 的 下 标 以 0 开始 编号 ， 可 以 是 整数 或 算术 表 
达 式 ， 其 值 应 大 于 或 等 于 0。 定 义 Shell 数组 的 命令 格式 是 : 

amay name=(valuel .. valuen) ”或 ”array_name[ij-valuel 


前 者 给 整个 数组 赋 初 值 ， 值 之 间 用 “空格 ” 隔 开 ;后 者 给 一 个 数组 元 素 赋值 。 引 用 Shel 数 组 元 
素 时 ， 必 须 用 花 括 号 括 起 数组 元 素 名 ， 格 式 为 : 


和 4s 
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S{aray_name[index]} 


array.sh 是 使 用 数组 的 Shell 脚本 示例 : 


1 #1/bin/sh 

2 NAME[OF"Zara" 

3 ”NAMEIIF'Qadir' 

4 ”NAMEDF"Mahnaz" 

5 echo"FirstIndex: SINAME[0]}" 
6 _ echo "Second mdex:S$INAMED]" 
运行 结果 如 下 : 

S$ /array.sh 

First Index: Zara 

Second Index: Qadir 


2.6.1 标准 文件 描述 符 


Linux 系统 以 文件 处 理 功 能 见长 ， 它 把 普通 文件 、IO 设备 、 网 络 连接 都 看 成 文件 ， 从 而 便于 将 
输入 输出 设备 、 网 络 通信 连接 统一 看 成 文件 IJO， 简 化 IO 概念 和 IO 编程 。Linux 使 用 文件 描述 符 
(file descriptoD 标 识 每 个 文件 对 象 ， 文 件 描述 符 是 一 个 非 负 整数 ， 每 个 进程 中 有 多 达 1024 个 文件 描 
述 符 (实际 限额 可 用 命令 ulimit 查看 和 设置 )。 

前 三 个 文件 描述 符 0、1、2 用 于 特殊 用 途 ， 分 别称 为 标准 输入 、 标 准 输出 、 标 准 错误 输出 ， 如 
表 2-8 所 示 ， 可 在 脚本 或 C 语言 程序 中 直接 使 用 ， 进 行文 件 读 写 操作 。 


表 2-8 Linux 标准 文件 描述 符 


文件 描述 符 


标准 输入 是 指 脚本 程序 执行 read 命令 或 C 程序 执行 scanf 操作 时 ， 输 入 数据 来 自 的 地 方 ， 一 般 
是 指 键盘 ,文件 描述 符 是 0; 标准 输出 是 Shell 中 echo 语句 或 Linux 命令 程序 执行 printf 等 语句 时 产 
生 的 输出 流向 的 地 方 ， 一 般 是 终端 或 监视 器 ， 文 件 描述 符 是 1。 标 准 错误 输出 是 命令 执行 过 程 中 产 
生 的 出 错 信息 送 往 的 地 方 ， 一 般 也 是 终端 或 监视 器 ， 但 文件 描述 符 是 2。 

出 错 信息 是 命令 执行 过 程 中 因 找 不 到 命令 、 命 令 拼写 错误 、 文 件 无 执行 权限 、 待 访问 文件 不 
存在 等 导致 命令 无 法 正常 执行 输出 的 错误 ,显示 格式 一 般 为 “命令 名 : 出 错 描述 ”， 如 “1s: cannot 
access bad file: No such file or directory”“a.exe: command not found”。 虽 然 命令 的 正常 输出 信息 和 
错误 输出 信息 都 在 命令 窗口 或 终端 输出 ， 但 它们 对 应 完全 不 同 的 文件 描述 符 ， 需 要 时 可 将 它们 分 离 
开 来 。 
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2.6.2 IJ/O 重 定向 


有 时 想 将 命令 输出 存 入 文件 ， 而 不 是 在 命令 窗口 或 终端 显示 ， 有 时 希望 从 文件 获得 输入 ， 而 不 
是 从 键盘 。 由 于 Linux 将 IO 设备 统一 看 成 文件 ， 因 此 通过 将 文件 描述 符 0、1、2 改 为 指向 相应 的 
文件 就 可 做 到 。Linux 通过 输入 /输出 (VO) 重 定向 机 制 来 提供 这 种 功能 。 


1. 输出 重 定向 


输出 重 定向 是 将 本 来 送 往 命令 窗口 的 输出 信息 ， 改 为 送 往 指定 文件 。 要 将 输出 重 定向 到 文件 ， 
只 需要 在 命令 名 后 加 大 于 符号 (>) 和 文件 名 : 

command > outfile 

这 样 ， 任 何 命令 中 应 该 显示 到 命令 窗口 的 内 容 都 被 写 到 指定 的 输出 文件 。 比 如 date 命令 本 来 是 
显示 当前 系统 日 期 与 时 间 ， 进 行 输出 重 定向 后 ， 输 出 被 改 为 送 往 文件 outfile。 

S$dale> outfile 

Sls -1 outfile 

-ITW-I--I-- 1 Tich rich 29 Sep 24 17:56 outfile 


Scat outfle 
Tue May 24 17 : 56:58 EDT 2016 


date 命令 的 输出 被 重 定向 到 文件 outfle。 如 果 输出 文件 已 经 存在 ， 就 会 用 命令 输出 数据 覆盖 文 
件 原 有 内 容 。 

如 果 要 将 命令 输出 附加 到 现 有 文件 内 容 之 后 ， 而 不 是 重 写 文件 内 容 ， 可 以 用 两 个 大 于 号 (>>) 进 
行 重 定向 。 例 如 ， 以 下 脚本 将 命令 who 的 输出 附加 到 文件 outfile 之 后 : 


$ who >> outfile 

$cat outfile 

Tue May 24 17 : 56:58 EDT 2016 
xuqg :0 2016-06-2201:22(:0) 


2. 输入 重 定向 

输入 重 定向 与 输出 重 定向 类 似 ， 它 使 原先 需要 从 终端 命令 窗口 读 取 的 输入 信息 改 从 指定 文件 读 
取 。 输 入 重 定向 符号 是 小 于 符号 (<)， 格 式 为 : 

command < infile 


比如 命令 we 的 功能 是 对 用 户 从 命令 窗口 输入 的 文本 进行 计数 ， 统 计 输 入 行 数 、 单 词 数 、 字 符 
数 信息 ， 利 用 输入 重 定向 可 对 文本 文件 进行 统计 : 


S$ wc < infile 
3 "13 "64 


结果 显示 : infile 文件 有 2 行 、13 个 单词 和 64 个 字符 。 
3. 标准 错误 输出 重 定向 


当 某 个 文件 badfile 不 存在 时 ， 使 用 标准 输出 重 定向 ， 可 能 会 看 到 如 下 现象 : 
Sls al badfile>outfile 


和 so 
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1s: cannot access badfile : No such file or directory 

Scat outfile 

原因 是 ,上 述 命令 仅 将 原本 送 往 文件 描述 符 STDOUT 的 正常 输出 重 定向 到 outfile, 而 “ls: : cannot 
access badfile : No such file or directory” 是 出 错 信息 ， 原 本 送 往 标准 错误 输出 STDERR， 因 此 不 会 重 
定向 到 文件 outfle。 如 果 需 要 重 定向 ， 可 使 用 重 定向 符号 “2>”， 将 原本 送 往 STDERR( 即 文件 描述 
符 2) 的 出 错 信息 送 到 指定 文件 。 

$1s -albadfile 2>errfile 


Scat errfile 
1s: cannot access badfile: No such file or directory 


如 果 要 将 正常 输出 和 出 错 信息 重 定向 到 不 同文 件 保存 ， 可 使 用 两 个 重 定向 符号 来 实现 : 


Sls -al test test?2 test3 badtest 2>test6 1>test7 
$ cat test6 

1s : cannot access test: No such file or directory 

1s: cannot access badtest: No such file or directory 

Scat test7 

-IW-IW-I-- 1 rich rich 158 2007-10- 26 11 :32 test2 
-IW-IW-I-- 1 rich rich 0 2007- 10-26 11:33 test3 


正常 输出 被 送 到 符号 “1>” 后 的 文件 ， 出 错 信息 则 被 送 到 “2>” 后 的 文件 。 可 以 使 用 这 种 办 法 
将 脚本 或 命令 中 发 生 的 任何 错误 消息 与 正常 脚本 输出 分 离开 来 。 
品 思考 与 练习 题 2.7 找 出 用 户 当前 主 目录 下 所 有 的 C 程序 文件 的 路 径 ， 存 入 文件 cfile lst。 


2.6.3 ”管道 


Linux 系统 中 经 常 需要 将 一 条 命令 (或 脚本 ) 的 输出 送 往 另 一 个 命令 (或 脚本 )， 这 样 可 以 给 操作 管 
理 带 来 极 大 方便 。 Linux 提供 的 管道 机 制 用 来 满足 这 种 需求 。 管道 的 符号 是 竖 条 操作 符 (), 用 管道 连 
接 命令 的 格式 是 : 

commandl | command2 

上 述 语法 将 command1 的 输出 直接 送 往 command2 作为 输入 ， 也 就 是 说 ，commandl 原本 要 送 
到 命令 窗口 的 输出 现在 改 为 送 往 命令 command2， 而 command2 原本 要 从 键盘 读 入 的 信息 ， 现 在 改 
为 从 commandl 的 输出 读 取 。 

由 管道 连接 并 同时 运行 的 两 条 命令 ， 被 系统 连接 到 一 起 。 第 一 条 命令 生成 输出 时 ， 立 即 发 送 给 
第 二 条 命令 ， 没 有 使 用 中 间 文 件 来 传递 数据 。 在 下 面 的 示例 中 ，cat 命令 读 取 Linux 系统 用 户 数据 库 
文件 /etc/passwd 的 内 容 , 并 将 输出 直接 传送 给 grep 命令 进行 过 滤 ，grep 命令 将 包含 字符 串 bash 的 文 
本 行 挑选 出 来 ， 即 找 出 所 有 能 正常 登录 的 用 户 ， 产 生 的 结果 如 下 所 示 : 

Scat /etcpasswd|grep /bin/bash 

TOOt:x:0:0:root:/root:/bin/bash 

couchdb:x:105:113:CouchDB Administrator...:/var/lib/couchdb:/bin/bash 

linux:x:1000:1000:Farsight...:/home/linux:/bin/bash 

can:x:1002:1002::/home/can:/bin/bash 

由 于 管道 工作 具有 实时 性 ，cat 命令 一 产生 数据 ，grep 命令 就 立刻 取 来 进行 筛选 。 当 cat 命令 完 
成 数据 输出 时 ，grep 命令 也 完成 数据 过 滤 和 结果 显示 。 命 令 中 可 以 使 用 的 管道 数 一 般 不 受 限 制 ， 但 
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一 行 最 多 255 个 字符 。 因此, 可 以 在 命令 中 使 用 多 个 管道 , 将 两 条 以 上 的 命令 或 脚本 程序 首尾 连接 ， 
实现 更 强大 的 功能 。 下 面 给 前 面 的 管道 命令 增加 一 级 处 理 ， 用 命令 wc -1 计算 grep 命令 输出 的 行 数 : 

Scat /etcpasswad|grep Pin/bash|we -I 

4 

结果 表明 ， 用 户 数据 库 中 有 4 个 用 户 账号 信息 包含 字符 串 “bash”。 

LO 重 定 向 、 管 道 是 Linux 系统 中 很 好 的 功能 特性 ， 能 为 操作 管理 Linux 系统 带 来 极 大 方便 ， 已 
经 为 微软 所 认同 ，Windows 10 已 融入 输入 重 定 向 、 输 出 重 定 向 、 管 道 的 完整 功能 。 


2.6.4 从 文件 获取 输入 


尽管 Linux 的 很 多 命令 都 能 对 文件 进行 读 写 和 处 理 ,但 要 让 Shell 脚本 从 文件 中 把 数据 一 行 一 行 读 
出 来 , 供 后 面 的 代码 进行 处 理 , 可 不 是 一 件 容易 的 事情 。 但 有 了 管道 机 制 的 支持 ,这 就 变 得 容易 多 了 。 
bash 从 标准 输入 读 取 数据 的 命令 是 read， 每 次 读 一 行 。 有 了 管道 机 制 ， 我 们 可 以 将 cat 命令 的 
输出 通过 管道 送 给 read 命令 。 若 输入 文件 有 多 行 数据 要 读 出 来 ， 则 将 cat 输出 送 往 while read 命令 。 
piperead.sh 是 一 个 脚本 示例 : 
#1/bin/bash 
count=] 
en 
do 


ho "Line $count : $line" 
unt=$[ $count+ 11] 
done 
echo "对 文本 文件 信息 完成 加 行 号 处 理 " 


以 下 是 数据 文件 和 脚本 运行 结果 : 

Scat test 

Software Department 

Computer School 

Dongguan University of Technology 

$ /piperead.sh 

Line 1: Software Department 

Line 2: Computer School 

Line 3: Dongguan University of Technology 

对 文本 文件 信息 完成 加 行 号 处 理 ! 

在 上 述 示例 中 ，while 命令 使 用 read 命令 不 断 循环 处 理 文件 中 的 每 一 行 ， 直 到 read 命令 读 完 所 
有 文本 行 后 以 非 0 的 终止 状态 码 退出 。 


命令 行 参数 


向 Shell 脚本 传递 数据 的 另 一 种 常用 方式 是 使 用 命令 行 参数 (command line parameter)。 使 用 命令 
行 参数 可 以 在 执行 脚本 时 向 命令 行 中 添加 数据 : 


S$/laddem 10 30 


Ls2 
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这 个 例子 向 脚本 addem 传递 了 两 个 命令 行 参数 (10 和 30)。 

Bash Shell 将 在 命令 行 中 输入 的 所 有 参数 赋值 给 一 些 称 为 位 置 参数 (positional parameter) 的 特殊 
变量 。bash 位 置 参数 的 取 名 就 是 一 个 十 进 制 数字 ， 赋 值 操作 在 脚本 启动 时 由 bash 完成 ， 脚 本 代码 可 
以 引用 它们 的 值 。bash 位 置 参数 的 含义 固定 ， 引 用 它们 的 值 时 ，30 为 脚本 程序 的 完整 路 径 ，$1 为 
第 一 个 命令 行 参 数 ，$2 为 第 二 个 命令 行 参数 ， 依 此 类 推 ， 直 到 $9 为 第 九 个 命令 行 参数 。posparl.sh 
是 一 个 简单 示例 : 

#!/bin/bash 
# testing two command line parameters 
echo 程序 完整 路 径 是 : $0. 


echo 第 一 个 参数 $1. 
echo 第 二 个 参数 ，52. 
echo 第 三 个 参数 ，$3. 


下 面 是 运行 结果 : 

S$ /posparl.sh One "Param2" Three 

程序 完整 路 径 是 : ,posparl.sh. 

第 一 个 参数 One. 

第 二 个 参数 ，Param 2. 

第 三 个 参数 : Three. 

需要 注意 的 是 : 当 某 个 命令 行 参数 是 一 个 中 间 包 含 空格 的 字符 串 时 ， 该 参数 必须 用 引号 括 起 ， 
否则 会 被 bash 拆 分 成 多 个 命令 行 参数 。 
和 思考 与 练习 题 2.8 ”阅读 下 列 Shell 脚本 pospar2.sh: 

#1/bin/bash 

echo $2 

echo $1 

echo $0 

写 出 以 下 命令 的 输出 结果 : 


Schmod +x pospar2.sh 
S$ /pospar2.sh Rich "glad ito meet you” 


Shell 函数 


编写 比较 复杂 的 Shell 脚本 时 ， 一 些 公共 代码 可 能 需要 重复 使 用 ， 以 提高 编程 效率 。Bash Shell 
通过 函数 来 满足 这 种 要 求 。 函 数 是 被 赋予 名 称 的 脚本 代码 块 ， 可 以 在 代码 的 任意 位 置 重 用 。 


*2.8.1 函数 的 基本 用 法 
可 以 使 用 两 种 格式 在 Bash Shell 脚本 中 创建 函数 。 一 种 格式 是 使 用 关键 字 fanction， 后 跟 代码 块 
的 函数 名 : 


function name { 
commands 
} 


过 


name 属性 定义 了 函数 的 唯一 名 称 。 脚 本 中 自 定义 的 每 个 函数 都 必须 赋予 唯一 的 名 称 。commands 
是 组 成 函数 的 一 条 或 多 条 Bash Shell 命令 。 脚 本 中 调用 函数 的 方法 与 执行 Linux 命令 的 方法 相同 ， 
funl.sh 是 一 个 示例 脚本 : 


#1/bin/bash 
function funcl { 
echo "This is an example of a function" 
} 
count=1 
while[ $count -le3] 
do 
funcl 
count=$[ $ count + 1] 
10 done 

11 __echo "Thisis the end of the loop” 

以 下 是 运行 结果 : 

S$ Munl.sh 

This is an example of a function 

This is an example of a function 

This is the end of the loop 


*2.8.2 ”向 函数 传递 参数 


可 以 使 用 标准 环境 变量 给 函数 传递 参数 。 例 如 ， 函 数 名 在 变量 $0 中 定义 ， 函 数 命令 行 的 其 他 参 
数 使 用 变量 $1 和 $2 等 定义 ， 专 用 变量 $# 可 以 用 来 确定 传递 给 函数 的 参数 数目 。fun2.sh 是 一 个 示例 
脚本 : 


ownaeewhwmwnb 


1  #/bin/bash 

2 加 assing parameters to a fnction 
3 fonction addem { 

4 if[S#-eq0]I[S#-et2] 

5 then 

6 echo -1 

"| 

8 echoS$[$1+$2] 

入 

10 echo-n"Adding 10and 15:" 
11 value= addem1015° 

12 _ echo $value 


以 下 是 运行 结果 : 
S$ fun2.sh 
Adding 10 and 15: 25 


本 章 小 结 


本 章 主要 讲述 Shell 基本 编程 方法 、Shell 环境 变量 、Shell 控制 结构 、Shell 函数 、Shell 输入 输 


Ls 
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出 的 基本 概念 、 语 法 结构 和 编程 方法 ， 其 中 介绍 的 示例 都 浅显 易 懂 ， 有 助 于 读者 掌握 Shell 基本 编 
程 方法 。 本 章 重点 是 Shell 变量 、 输 入 输出 重 定向 、 管 道 、 环 境 变 量 、 标 准 文件 描述 符 的 概念 和 基 
本 使 用 方法 。 

Linux Shell 具有 一 般 编 程 语 言 的 特性 和 基本 语言 结构 : Shell 中 能 定义 变量 ,支持 全 局 变量 和 局 
部 变量 ，Shell 具有 条 件 (if-then-else)、 选 择 (case) 和 循环 (for、while、untiD) 三 大 控制 结构 。Shell 是 解 
释 型 语言 ，Shell 程序 在 对 变量 赋值 前 不 需要 进行 声明 和 定义 。Shell 程序 的 基本 语句 包括 所 有 系统 
命令 用户 程序 和 已 存在 的 Shell 程序 。 Shell 程序 访问 环境 变量 和 文件 列表 极为 方便 。 这 些 都 给 Shell 
编程 带 来 极 大 方便 ，Shell 非常 适合 创建 用 于 系统 管理 的 脚本 程序 。 

作为 一 般 的 计算 机 技术 人 员 ， 理 解 Shell 循环 结构 、 计 控制 结构 、Shell 函数 的 基本 语法 结构 是 
必要 的 ， 要 掌握 Shell 基本 编程 方法 、 环 境 变量 、 管 道 、 用 户 输入 、 数 据 输出 ， 尤 其 要 掌握 标准 文 
件 描述 符 、 命 令 行 参数 的 概念 ， 掌 握 命令 行 参数 的 读 取 方 法 也 是 必需 的 。 


课 后 作业 


和 思考 与 练习 题 2. 9 编写 一 个 Shell 脚本 ， 完 成 如 下 功能 : 
(1) 显示 文字 “Waiting for a while....”。 
(2) 以 长 格式 显示 当前 目录 下 的 文件 和 目录 ， 并 将 输出 重 定向 到 /home/file.txt 文件 。 
(3) 定义 一 个 变量 ， 名 为 s， 初 始 值 为 “Hello”。 
(4) 将 该 变量 的 输出 重 定向 到 /home/string.txt 文件 。 
和 思考 与 练习 题 2.10 ”编写 一 个 Shell 脚本 ， 利 用 for 循环 将 当前 目录 下 的 .c 文件 移动 到 指定 
的 目录 ， 并 按 文件 大 小 显示 文件 移动 后 该 指定 目录 的 内 容 。 
如 > 思考 与 练习 题 2.11 输入 十 个 整数 ， 要 求 输 出 最 大 值 ， 最 小 值 ， 平 均值 以 及 求 和 结果 。 
多 思考 与 练习 题 2.12 编写 脚本 ， 求 n 的 阶乘 ，n=100。 
寻 思考 与 练习 题 2.13 编写 脚本 ， 给 出 每 天 18:00 归档 至 /etc 目录 的 所 有 文件 ， 归 档 文件 名 为 
如 下 形式 : etc-YYYY-MM-DD. 保存 在 /home/user/backup 目录 下 , 其 中 user 为 当前 登录 用 户 名 。 
比 思考 与 练习 题 2.14 编写 脚本 ， 创 建 目录 和 文件 。 
目录 名 为 : dirl, dir2, ..., dir10。 
在 每 个 目录 下 分 别 新 建 10 个 文本 文件 ， 文 件 名 为 : 目录 名 +filel~ file10 
设置 每 个 文件 的 权限 。 
@ 文件 所 有 者 : 读 + 写 + 执行 
@ 同 组 用 户 : 读 + 执行 
@ 其 他 用 户 : 读 + 执 行 
旨 ” 思考 与 练习 题 2.15 假设 testl.sh 文件 的 内 容 如 下 : 
#!/bin/bash 
echo S$# 
echo $2 


echo Smyvarl 
echo S$Smyvar2 


写 出 以 下 命令 序列 中 最 后 两 个 命令 的 输出 : 


S$ export myvarl="global var” 

S$ myvar2="Iocal var” 

Schmod +x testl.sh 

S/hestl.sh rich "barbara Katie™” 
Ssource /estlsh one two three 


绪 思考 与 练习 题 2.16 分 析 下 面 的 程序 ， 简 要 说 明 其 整体 功能 ， 并 解释 每 条 语句 。 


#1/bin/sh 

val=1 

while (test $val -lt 6) 
do touch file$val 
date>>fileSval 

va expr $val + 1 
done 
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Linux 系统 下 一 般 使 用 C 语言 编写 系统 程序 以 及 对 性 能 有 较 高 要 求 的 程序 ,Linux 环境 通常 使 用 
gce 套件 编译 程序 ， 运 用 gdb/ddd 调试 工具 进行 程序 的 调试 和 排 错 。Windows 系统 的 开发 环境 (如 
Visual Studio 2018) 一 般 可 将 这 两 种 功能 集成 在 一 起 使 用 ，Linux 虽然 也 有 一 些 这 样 的 集成 开发 环境 ， 
如 Eclipse， 但 很 多 熟练 的 程序 员 喜 欢 直 接 用 gce 命令 行 工具 进行 开发 ， 这 样 编程 效率 更 高 。 本 章 介 
绍 用 Linux 环境 中 的 gcc 开发 套件 对 程序 进行 编译 、 调 试 、 排 错 和 项 目 管理 的 基本 方法 ， 是 Linux 
环境 下 使 用 C/C++ 进行 系统 编程 和 应 用 编程 开发 的 基础 ， 其 中 涉及 的 方法 和 原理 也 适用 于 Windows 
等 非 Linux 环境 。 


本 章 学 习 目 标 : 

理解 Linux C 程序 的 编译 、 执 行 过 程 ，gce 命令 选项 ， 自 定义 函数 库 的 制作 
熟悉 Linux C 程序 中 编程 错误 的 诊断 与 处 理 方法 

熟悉 使 用 Linux 自 带 的 字符 串 运算 、 排 序 算法 、 二 又 树 算法 库 编写 应 用 程序 
熟悉 使 用 gdb/ddd 调试 Linux C 程序 

掌握 利用 命令 行 参 数 和 环境 变量 给 程序 提供 数据 

能 够 使 用 make 工具 管理 大 型 C/C++ 编 程 项 目 


Linux C 程序 的 编译 与 执行 


3.1.1 Linux 环境 下 C 程序 的 编译 与 执行 过 程 


首先 创建 并 进入 目录 ~/work/chap3， 用 vi 或 gedit 创建 hello.c 程序 : 
#include <stdio.h> 
void main 0 
{ 
Printf("hello Worldn") : 
} 


然后 输入 下 列 命令 ， 对 hello.c 程序 进行 编译 : 


Sgce hello.c 

使 用 命令 “1s -1” 列 出 当前 目录 下 所 有 的 文件 ， 会 发 现 产 生 一 个 名 为 a.out 的 程序 ， 这 就 是 执行 
gcc 命令 后 产生 的 可 执行 文件 。 最 后 输入 如 下 命令 以 执行 该 程序 : 

S$ /out 

Hello world 

你 已 经 看 到 程序 的 执行 结果 。 这 里 使 用 的 gcc 命令 就 是 Linux 环境 下 的 C 语言 编译 器 。 在 这 里 ， 
使 用 一 条 命令 就 将 C 程序 编译 成 了 可 执行 文件 ， 但 在 开发 比较 复杂 的 应 用 时 ， 需 要 按 不 同方 式 使 用 
gcc 命令 ， 以 实现 多 文件 链接 、 程 序 调试 、 程 序 优化 等 功能 。 为 此 ， 需 要 了 解 gce 编译 器 的 使 用 方 
法 和 C 程序 的 编译 链接 过 程 。 

gcc 命令 的 用 法 如 下 : 

gcc [选项 | 文件 名 称 

gcc 的 命令 选项 多 达 100 个 , 这 里 只 介绍 最 常用 、 最 基本 的 选项 , 更 多 的 选项 可 通过 命令 man gce 
查看 gcc 命令 的 参考 手册 。 

gcc 将 源 程序 转换 为 可 执行 文件 需要 经 历 预 处 理 、 编 译 、 汇 编 以 及 链接 四 个 过 程 。gcc 处 理 过 程 
如 图 3-1 所 示 。 


源 代码 .c 


预 处 理 处 理 头 文件 和 预 编译 语句 ， 生 成 i 文件 


编译 生成 .s 汇编 代码 文件 


六 
汇编 将 编译 阶段 生成 的 .s 文件 转换 成 目标 文件 .o = 


广 
链接 将 目标 文件 和 所 用 的 库 函 数 链接 到 ld 
可 执行 文件 中 的 适当 位 置 ， 生 成 可 执行 文件 


图 3-1 GCC 处 理 过 程 


1. 预 处 理 


第 一 步 为 预 处 理 ，gce 调用 预 处 理 程序 cpp， 扫描 源 代码 ， 检 查 其 中 的 宏 定义 与 预 处 理 指令 ， 执 
行 宏 替 换 ， 展 开 包 含 文件 ， 删 除 程序 中 的 注释 以 及 多 余 的 空白 字符 。 例 如 ，#include<stdio.h> 是 一 条 
预 处 理 指令 ， 这 一 步 将 在 该 位 置 展开 被 包含 的 文件 。 将 - 选项 传 给 gce 命令 ， 表 示 仅 对 输入 文件 进 
行 预 处 理 ， 将 预 处 理 的 输出 送 到 标准 输出 。 

假定 有 以 下 文件 test.c: 


#include <stdioh> 


#define sum(ab) atb 
void main0 
{ 
int num=sum(1.2): 
Pprintf("num=%dn" num): 


ami- 


第 3 章 Linux C 编程 环境 


Enii is y 


带 命令 选项 下 的 gece 命令 调用 预 处 理 程序 cpp， 对 源 程 序 test.c 做 预 处 理 ， 消 除 所 有 以 字符 “#” 


开头 的 语句 ， 展 开头 文件 ， 执 行 宏 蔡 换 ， 按 条 件 编译 过 滤 源 代码 ， 产 生 不 预 处 理 后 的 源 代 码 。gcc 
用 -o 选项 (o 是 单词 output 的 首 字母 ) 指 定 预 处 理 后 产生 的 源 代 码 文件 名 ，-o 和 输出 文件 名 间 需 要 加 
空格 ， 预 处 理 的 输出 文件 一 般 以 i 为 后 缀 : 


Sgcec testc -E -0 testi 

现在 查看 testi 文件 的 内 容 ， 可 以 看 到 : 
Scat testi 

typedef unsigned char _u_ char 

typedef unsigned short int _u_short 

typedef unsigned int_ u_int: 


typedef unsigned long int _u long:; 0 stdioh 和 
#918 "/ust/include/stdio.h" 3 4 
#2 "test.c" 2 
void main 0 
int num=1+2 宏 sam(1.2) 被 蔡 换 成 宏 定义 
Printf (" num=%odm " , num) : 表达 式 "1+2" 


} 
文件 中 最 上 面 一 部 分 是 stdio.h 文件 展开 后 的 内 容 , 而 代码 “int num=1+2 ”是 宏 替 换 结果 ,用 “1+2” 


替换 了 “sum(1,2)”。 


2. 编译 
带 命令 选项 -S 的 gce 命令 调用 编译 程序 ccl， 对 .c 或 i 源 程序 进行 编译 ， 产 生 汇编 语言 代码 ， 用 


-0 指定 汇编 代码 文件 名 ， 缺 少 -o 选项 时 则 生成 与 源 程序 同名 的 .s 汇编 代码 文件 。 例 如 用 下 面 的 gce 
命令 编译 test.c， 生 成 汇编 语言 程序 test.s: 


Sgcc -8 -0 fests festc # 编译 未 经 预 处 理 的 源 程序 testc 
或 $gce testi -8 -0 tests # 也 可 编译 预 处 理 后 的 代码 testi 

# 文件 名 testi 也 可 置 -o 选项 前 
或 $gce -8 testc # 无 -o 选项 ， 默 认 的 输出 文件 名 
# 与 输出 文件 名 相同 ， 仅 后 级 为 .s 


可 用 cat 命令 查看 test.s 文件 的 内 容 : 


Scaf -n tests  ”# 显 示 编译 生成 的 汇编 代码 
1 .file "hel.e" 

2 ‘section .rodata 

3 IC0: 

4 .string"num=%d\n" 
5 text 

6 .globlemain 

7 -type main, @function 
i 

号 


main: 
LFBO: 


10 andl $-16. %esp 

11 subl $32.,%esp 

12 mov] $3,28(%esp) 
13 mov]l 28(%esp), %eax 
14 mov]l %eax,4(%esp) 
15 movl $LCO0., (%esp) 
16 call printf 


gcc 采用 AT&T 汇编 语言 语法 格式 ,不 使 用 通常 教科 书 采用 的 Intel 汇编 语言 风格 。 下 面 对 产 生 
的 汇编 代码 做 简单 解析 ， 从 而 让 读者 对 常量 、 变 量 地 址 分 配 和 函数 调用 方法 有 个 基本 了 解 。test.s:4 
定义 了 testc:6 中 printf 调用 的 字符 串 参数 ; test.s:18 是 testc:5 的 汇编 代码 , 它 将 常量 3 写 入 变量 num 
所 在 堆栈 位 置 28(%besp)， 表 明 给 局 部 变量 分 配 的 逻辑 地 址 在 堆栈 中 ; tests:19 将 变量 num 的 值 读 到 
通用 寄存 器 eax 中 ; tests:20 将 该 值 压 入 堆栈 ， 作 为 printf 函数 调用 的 参数 ，tests:21 将 字符 串 
“num=%dm” 的 地 址 压 入 堆栈 ， 作 为 printf 函数 调用 的 第 二 个 参数 ，test.s:22 用 指令 call 调用 printf 
函数 。 


3. 汇编 

命令 选项 -c 指示 gcc 调用 汇编 程序 as， 将 上 一 步 产 生 的 汇编 代码 汇编 成 目标 机 机 器 指令 ， 它 生 
成 与 源 程 序 同名 的 .o 目标 代码 文件 。 用 -c 选项 表示 让 gce 仅 完成 前 三 步 ， 即 可 实现 对 源 代码 的 预 编 
译 、 编 译 和 汇编 。 下 面 的 gcc 命令 可 对 test.c、 testi 或 test.s 进行 编译 ,汇编 , 生成 目标 代码 文件 test.o: 


Sgcec lestc -ce -0 festo 
或 S$gee fests -< -0 testo 
或 Sgcc festi -Cc -0 testo 


test.o 虽然 是 test.c 的 二 进 制 代码 ， 但 并 不 可 直接 执行 ， 因 为 其 中 存在 未 定义 的 函数 printf。 可 使 
用 nm 命令 查看 testo 文件 中 的 符号 ， 核 实 这 个 事实 : 


Snmm festo 


00000000 Tmain 

Uprintf 

test.o 目标 文件 中 有 两 个 符号 ， 分 别 为 main 和 printf。 请 注意 ，main 前 面 的 工 表示 符号 在 test.o 
目标 文件 的 代码 段 中 已 有 定义 ;printf 前 的 U 表示 该 符号 未 定义 , 意味 着 在 当前 文件 中 没有 找到 printf 
函数 的 实现 代码 ， 需 要 从 外 部 库 链 接 进 来 。 


4. 链接 


使 用 不 带 -S$、-c、-E 选项 的 gcc 命令 将 根据 需要 ， 执 行 预 处 理 、 编 译 、 汇 编 ， 并 调用 链接 程序 
collect2， 将 一 个 或 多 个 目标 代码 文件 与 相关 库 文件 链接 起 来 ， 产 生 可 执行 文件 。 下 面 的 gce 命令 可 
对 testc、testi、tests 或 test.o 进行 编译 链接 ， 生 成 可 执行 文件 test。 


和 so 
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S$8cece fest.o -0 
Sgcc fests -0 fest 
lesti 0 

Sgcc testc -0 fest 


再 次 使 用 nm 命令 查看 test 文件 中 的 符号 : 


Snmm fest|grep printf 


080483c4 T main 
U prinf@GLIBC 2.0 

可 以 看 出 ,test 文件 中 己 有 函数 符号 printf 所 在 库 文件 的 信息 了 。 最 后 执行 test 文件 , 得 到 num=3 
的 结果 。 

S$ /est 

Dum=3 
绢 ”思考 与 练习 题 3.1 创建 如 下 C 程序 hello.c: 

#include<stdio.h> 

intmain0 { printf("hello worldn"): } 

写 出 生成 预 处 理 输出 文件 helloi. 汇编 文件 hello.s、 目标 文件 hello.o 和 可 执行 文件 hello 的 命令 ， 
写 出 查看 hello.o 和 hello 文 件 中 符号 的 命令 ， 并 练习 执行 这 些 命令 。 
多 思考 与 练习 题 3.2 通过 构造 合适 的 C 程序 ， 利 用 gcc 编译 命令 ， 找 出 下 列 语句 的 汇编 代码 : 


(Di 是 全 局 变量 (3)i 是 全 局 变量 

i=itl; for(i=0; i<10:; +) 1: 

(2) i 是 局 部 变量 (人 D1 是 局 部 变量 ，j 是 全 局 变量 
ii*10 for(i=0; i<10; HD){ ii: 


研究 这 些 汇编 代码 ， 解 释 全 局 变量 、 局 部 变量 是 如 何 存 储 的 ， 分 析 for 循环 的 汇编 代码 结构 。 


3.1.2 ”编译 多 个 源 文件 

假定 某 项 目 由 四 个 源 文件 构成 ， 第 一 个 源 文件 是 自 定义 函数 原型 说 明文 件 calc.h: 

double aver(double.double): 

double sum(double.double): 

第 二 和 第 三 个 源 文件 分 别 是 两 个 自 定义 函数 的 实现 ，aver.c 文件 实现 第 一 个 自 定义 函数 : 

#include "calc.h" 

double aver(double numl.double num2) 

b 

Tetum (numl+num2)/2: 

} 

由 于 了 文件 与 c 文件 处 在 同一 个 目录 ， 因 此 在 include 行 ， 在 文件 名 的 两 边 加 引号 。sumcc 文件 
实现 第 二 个 自 定义 函数 : 


#include "calc.h" 


件 。 


double asum(double numl.double num2) 
Tetum (numl+num2): 
} 
应 用 程序 为 libtest.c: 
#include <stdio.h> 
#include "calc.h" 
int main(int argc, char* argv[]) 
{ 
double v1, v2, msum2: 
Vi=32; 
V2=89; 
m=aver(vl, v2); 
sum2=asum(v1,v2); 
Printf ("The mean of %3.2f and %3.2fis %3.2fn" , v1, v2, m); 
Printf("The sum of % 3.2f and %3.2f1i5 %3.2fn" v1, v2, sum2); 
Tetum 0: 
} 


这 四 个 源 文件 构成 一 个 项 目 ， 其 中 只 有 三 个 在 编译 时 有 代码 输出 ，gcc 只 需要 编译 这 三 个 源 文 
编译 方法 有 两 种 。 
第 一 种 方法 是 分 开 编译 三 个 源 程序 ， 生 成 目标 代码 文件 ， 然 后 链接 产生 可 执行 文件 libtest， 最 


后 执行 即 可 : 


-SUM.C 
averc 
Sgcec -c libtestc 
-0 libtest sum.o aver.o libtest.o 
S$ Mibtest 
The mean of 3.20 and 8.90 is 6.05 
The sum of 3.20 and 8.90 is12.10 


第 二 种 方法 是 在 一 条 命令 中 完成 对 三 个 源 程序 的 编译 和 链接 ， 生 成 可 执行 文件 libtest: 


Sgccsum.c averc libtestec -o libtest 


旨 ” 思考 与 练习 题 3.3 ”如 果 将 calc.h 中 的 代码 行 “double sum(double.double):” 误 写成 “double 
asum(double, double):”， 请 测试 会 得 到 怎样 的 执行 结果 ， 并 解释 原因 。 


3.1.3 ”使 用 头 文件 和 库 文 件 


供 ， 


在 软件 开发 过 程 中 ， 经 常会 使 用 外 部 或 其 他 模块 提供 的 功能 ， 这 些 功能 一 般 以 库 文件 的 形式 提 
比如 输入 输出 要 调用 IO 库 函 数 ， 开 发 图 形 用 户 界面 需要 使 用 图 形 库 ， 开 发 动画 程序 需要 使 用 


OpenGL 库 ， 从 摄像 头 采集 视频 需要 调用 视频 库 。 未 来 开发 应 用 时 ， 几 乎 都 不 可 避免 机 使 用 某 种 库 
文件 (又 称 函 数 库 )， 这 些 库 文件 提供 的 函数 又 称 API 函数 。 


函数 库 是 由 一 些 提供 公共 功能 的 函数 、 代 码 、 变 量 定义 的 二 进 制 代码 文件 ， 可 被 各 种 应 用 程序 


调用 ， 链 接 到 它们 的 可 执行 程序 中 。 函 数 库 里 有 Linux 系统 自 带 库 函 数 、 第 三 方 库 函 数 和 用 户 自 定 
义 库 函数 。 为 让 调用 库 函 数 的 程序 能 正确 编译 链接 和 执行 ， 需 要 做 三 件 事情 : 


(1) 第 一 件 事情 是 用 “#nclude” 语 句 将 这 些 库 函 数 的 原型 、 相 关 类 型 定义 的 头 文件 添加 到 源 程 
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序 的 前 面 。 
通常 stdioh 包含 常用 标准 IO 库 函 数 的 原型 声明 ， 所 以 C 语言 程序 的 第 一 行 都 是 “#include 
<stdioh>”。 但 如 果 想 要 调用 其 他 库 函 数 ， 源 文件 需要 将 声明 其 原型 的 头 文件 包含 进来 。 如 果 不 知 
道 系统 中 库 函 数 的 头 文件 名 称 ， 可 使 用 Linux 命令 man 查询 函数 使 用 说 明 ， 如 查询 atoi 帮助 信息 的 
命令 是 “man atoi” 或 “man 3 atoi”。 本 章 后 面 列 出 了 常用 的 Linux 系统 自 带 库 函 数 的 功能 、 使 用 
方法 及 相关 头 文件 。 如 果 需 要 调用 第 三 方 API 库 函 数 ， 可 从 相关 厂商 取得 相应 头 文件 。 即 便 是 用 户 
自 定义 库 函 数 ， 程 序 员 也 应 创建 相关 头 文件 。 

(2) 在 gcc 链接 命令 中 用 -1 选项 (L 是 英文 单词 lnk 的 首 字母 ) 指 明 包 含 API 或 库 函 数 代码 实现 的 
库 文件 。 
库 文件 一 般 是 由 多 个 .o 文件 打包 而 成 的 文件 。 按 照 库 文件 加 载 时 机 的 不 同 ， 有 静态 库 及 动态 库 
(或 共享 库 ) 两 种 形式 。 当 用 选项 -Bstatic 指明 采用 静态 链接 时 ，gcc 将 静态 库 代 码 复制 到 每 一 个 可 执 
行文 件 中 ， 随 着 程序 启动 而 加 载 到 内 存 中 。Linux 静态 库 以 .a 为 文件 名 后 级， 对 于 名 为 name 的 静态 
库 ， 文 件 名 命名 规范 一 般 为 libname.a。 当 采用 动态 链接 时 ，gcec 仅 将 动态 库 的 链接 信息 写 到 可 执行 
文件 中 ， 不 复制 库 函 数 代码 ， 生 成 的 可 执行 文件 比较 小 。 动 态 库 仅 当 程序 运行 过 程 中 实际 调用 库 中 
的 函数 时 才 加 载 到 内 存 中 。 动 态 库 又 称 共 享 库 ， 仅 在 内 存 中 保存 一 个 副本 ， 为 多 个 应 用 程序 共用 ， 
节省 内 存 用 量 。 当 动态 库 修正 错误 或 更 新 升级 时 ， 只 要 调用 接口 不 变 ， 使 用 它 的 源 程序 就 不 需要 重 
新 编译 。 动 态 库 的 文件 名 后 组 为 .so， 对 于 名 为 name 的 动态 库 ， 文 件 命名 规范 一 般 为 ibname.so。 

系统 库 函 数 、 第 三 方 库 函 数 和 用 户 自 定义 库 函 数 都 有 相应 的 库 文 件 。Linux 自 带 的 库 文件 有 数 
十 个 之 多 ， 一 般 用 到 哪个 就 加 载 哪个 ， 为 此 需要 在 gce 命令 中 用 -1 选项 指明 函数 库 名 称 。 比 如 ， 如 
果 要 链接 库 文件 libname.so 或 ibname.a， 则 gcc 命令 要 增加 选项 -Iname。gcc 默认 使 用 共享 库 文件 ， 
如 果 要 使 用 静态 库 ， 则 应 增加 -Bstatic 选项 。 

由 于 大 多 数 程序 都 要 调用 scanf、printf、fread、fwrite 等 库 函 数 ，gce 在 默认 情况 下 自动 将 系统 
IO 库 libc.so 链接 到 可 执行 文件 , 因此 不 需要 用 链接 选项 “-lc ”指明 使 用 IO 库 文件 名 libc.a 或 libc.so。 
因此 ， 在 前 面 的 “gcc helloc” 命 令 中 就 没有 使 用 -1 选项 。 

但 如 果 调 用 了 其 他 种 类 的 库 函 数 ， 如 数学 运算 、 线 程 管理 函数 ， 就 必须 用 -1 选项 指定 库 文件 名 。 
例如 ， 下 面 的 程序 mathl.c 使 用 了 数学 运算 函数 sin， 其 代码 实现 在 系统 库 文件 ibm.so 中 : 


double pi=3.1415926; 
Printf("sin(pi/4)=%f\n",sin (pi/4)): 
Tetum 0; 
} 
源 代码 中 包含 sin 函数 的 头 文件 mathh， 程 序 能 够 正确 编译 : 


$gcc -c mathl.c 
$s 


但 链接 会 报错 : 


Sgcc -o mathl mathlo 或 Sgcc -0 math! mathic 
/tmp/ccxgYYLV.o: In function main : 


he.c:(.text+O0x2f): undefined reference to "sin' 

collect2: error: ld retumed 1 exit status 

该 错误 提示 找 不 到 函数 sn 的 定义 ， 这 是 因为 没有 将 函数 sin 的 实现 代码 所 在 的 库 文件 libm.so 
链接 到 可 执行 文件 。 现 在 ， 在 编译 命令 中 添加 -lm 选项 以 指明 要 链接 库 文件 libm.so: 

$gcc mathlc -o mathl -Im 

就 可 成 功 生成 可 执行 文件 mathl。 函 数 实现 所 在 的 库 文件 名 一 般 会 在 教科 书 、 参 考 书 或 第 三 方 
软件 包 说 明 中 介绍 。 

(3) 有 时 需要 用 工 选项 和 - 选项 分 别 指定 第 三 方 库 函 数 的 头 文件 和 库 文件 所 在 目录 

-Idir 选项 ([ 是 英文 单词 Include 的 首 字母 ): gcc 命 令 搜索 h 头 文件 的 默认 目录 ,一 般 是 /ust/include。 
如 果 被 搜索 的 头 文件 位 于 其 他 目录 下 ， 则 使 用 -I 选项 将 该 目录 增加 到 搜索 头 文件 的 路 径 中 。 注 意 ; 
工 后 面 紧 跟 包 含 文件 的 目录 路 径 , 中 间 无 空格 。 若 代码 行 #include<wrapper.h> 涉 及 的 文件 在 当前 目录 
下 ， 则 gce 命令 应 有 选项 “-IL”。 由 于 用 引号 指明 的 头 文件 规定 仅 在 当前 目录 下 搜索 ， 因 此 写成 代 
码 行 加 nclude "wrapperh" 时 就 不 需要 “- 工 ”选项 。 

-Ldir 选项 (L 是 单词 Link 的 首 字母 ): 通常 gcc 生成 可 执行 文件 所 需 的 系统 库 文件 位 于 默认 目录 
/usr/lib 下 ， 如 果 所 需 的 库 文件 位 于 其 他 目录 下 ， 则 使 用 - 工 将 该 目录 添加 到 库 文件 的 搜索 路 径 中 。 工 
与 库 文 件 目录 间 也 没有 空格 。 若 所 需 库 文件 在 当前 目录 下 ， 则 编译 命令 中 应 加 入 选项 “-L.”。 

图 3-2 及 图 3-3 分 别 是 静态 库 模型 及 共享 库 模型 。 图 3-4 与 图 3-5 则 分 别 是 静态 库 代 码 与 动态 库 
代码 的 应 用 过 程 。 


函数 a 的 


函数 a = 机 器 代码 
| 机 器 代码 a 
编译 链接 
源 程序 静态 库 的 可 执行 代码 
UL 1) 
gcc 编译 源 程序 
图 3-2 静态 库 模型 


图 3-3 动态 库 模型 


| 


图 3-4 静态 库 的 代码 被 复制 到 程序 中 
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程序 A 程序 B 


3-5 动态 库 代码 由 多 个 应 用 程序 在 运行 时 共享 


*3.1.4 使 用 gcc 创建 自 定义 库 文件 


尽管 很 多 情况 下 只 需要 调用 已 有 的 库 函 数 , 但 有 时 也 编写 一 些 函数 模块 供 他 人 使 用 , 或 作为 API 
库 发 布 给 开发 者 ， 这 时 可 以 创建 自己 的 库 文 件 。 

本 节 以 3.1.2 节 的 多 源 文件 项 目 为 例 来 演示 静态 库 和 动态 库 的 创建 及 使 用 方法 。 我 们 假定 aver 
和 sum 这 两 个 函数 属于 公共 功能 ， 要 被 很 多 程序 调用 ， 因 此 需要 将 它们 作为 库 函 数 处理 ， 将 源 文件 
averc 和 sum.c 的 代码 实现 创建 成 库 文 件 。 

(1) 静态 库 文件 的 创建 和 使 用 

要 用 averc 和 sum.c 创建 静态 库 ， 首 先 使 用 带 -c 选项 的 gcc 命令 仅 将 其 编译 为 目标 文件 ， 而 不 
进行 链接 ， 所 生成 的 目标 文件 分 别 为 aver.o、sum.o。 


Sgce -ec -0 Aaver.o aver.c 
Sgce -CC -0 SUMm.0O SUM.C 


然后 使 用 命令 ar 生成 静态 库 文件 libmycalc.a: 

Sar re libmycalca aver.o sum.o 

其 中 ，libmycalc.a 是 静态 库 文件 的 名 称 ， 必 须 以 lib 开头 ， 后 缀 必须 为 .a。 在 这 里 ， 参 数 了 表示 
将 目标 文件 加 入 静态 库 ， 参 数 c 表示 创建 新 的 静态 库 文件 。 检 查 静 态 库 文件 是 否 存 在 ， 并 查看 其 
属性 : 


Sls -1 libmycalc.a 
-IW-IW-I-—,] cmosos cosmos 1826 11-16 06:33 libmycalc.a 


源 程 序 libtest.c 调用 了 该 静态 库 中 的 aver 及 sum 函数 ,将 库 文件 libmycalc.a 与 其 链接 的 方法 是 : 

Sgce libtestc -Bstatic -L -imycalc -0 libtesta 

其 中 ，-Bstatic 选项 强制 gcc 使 用 静态 库 链 接 , 将 libmycalc.a 中 的 代码 复制 到 可 执行 文件 libtesta 
中 。 由 于 库 文件 libmycalc.a 在 当前 目录 而 非 系统 默认 的 库 文件 搜索 路 径 中 ， 因 此 必须 用 “-L.” 选 项 
将 当前 目录 “.” 添 加 到 库 文 件 搜索 路 径 中 ; 选项 -Imycale 表示 寻找 名 为 libmycalc.a 的 库 文件 ; -o 指 
定 可 执行 程序 的 名 称 。 

最 后 执行 该 程序 ， 获 得 如 下 结果 : 

S$ /Mibtesta 


The mean of 3.20 and 8.90 is 6.05 
The sum of 3.20 and 8.90 is 12.10 


(2) 动态 库 文件 的 创建 和 使 用 
首先 利用 如 下 命令 生成 源 程序 的 目标 文件 ， 其 中 参数 -fPIC 表示 生成 位 置 无 关 代 码 : 


Sgcec © JPIC averc -0 qver.o 
Sgcec - JPIC sumc -0 sum.o 


再 通过 以 下 命令 用 生成 的 上 述 目标 文件 avero 及 sum.o 创建 共享 库 : 

Sgcc -shared -0 libmycalc.so aver.o sum.o 

其 中 ，-shared 参数 告诉 gcc 生成 共享 库 ，libmycalc.so 是 生成 的 共享 库 文件 名 。 使 用 该 共享 库 
编译 链接 libtest.c 程序 的 命令 是 : 

Sgce libteste -L. -0 libtestso -lmycale 

选项 “-L.” 将 当前 目录 添加 到 库 搜 索 路 径 中 ，-lmycalc 表示 要 链接 库 文件 libmycalc.so。 可 查看 
libtest so 属性 以 检查 动态 库 是 否 生成 : 


Sl - 
-IWXIWXI-X. ] can can 5417 11-16 20:06 libtestso 


由 于 链接 的 是 动态 库 ，libmycalc.so 中 函数 aver 和 sum 的 实现 代码 并 没有 被 复制 到 可 执行 文件 
中 ， 需 要 在 libtestso 程序 的 执行 过 程 中 加 载 动 态 库 ibmycalcso， 因 此 必须 以 某 种 方式 将 动态 库 所 在 
目录 路 径 告知 加 载 程序 。Linux 系统 提供 两 种 方式 来 告知 动态 库 的 位 置 ; 第 一 种 方式 是 将 共享 库 路 
径 添加 到 环境 变量 LD _ LIBRARY PATH 中 ， 比 如 将 当前 目录 “.” 添 加 到 该 环境 变量 中 。 告 知 库 文 
件 libmycalc.so 路 径 的 方法 是 : 
Sexwport LD LIBRARY PATH=$LD LIBRARY PATH:. 
第 二 种 方式 是 将 自 定义 动态 库 添加 到 /etc/ld.so.conf 文件 中 。 这 是 学 习 树 莓 派 和 嵌入 式 应 用 开发 
时 需要 掌握 的 基本 知识 。 
设置 好 动态 库 路 径 后 执行 程序 ， 得 到 如 下 结果 : 
S$ Mibtestso 
The mean of 3.20 and 8.90 is 6.05 
The sum of 3.20 and 8.90 is 12.10 
可 以 试验 一 下 ， 若 用 命令 “mm libmycalc.so” 将 共享 库 libmycalc.so 删除 ， 再 次 执行 ./libtestso 命 
将 得 到 如 下 错误 信息 : 
Srm libmycalc.so 
S$ Mibtestso 
. /libtestso: error while loading shared libraries: libmycalc.so: cannot open shared object file: No such file or directory 
这 是 因为 共享 库 在 被 删除 后 ， 应 用 程序 在 执行 时 无 法 找到 所 使 用 共享 库 中 的 函数 。 
有 ”思考 与 练习 题 34 创建 以 下 程序 Atoic: 
int Atoi(char *s) 
{inti; 
int res=0; 
while (s[i]!="\0’ &é& res<1000000) 
{ 
if(s[i] >=°0° && sli] <—=°9") 
res=res*10+s[i]-0°; 
else 
Tetum 0; 


人 


} 
Tetum res: 


} 


和 ss 
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请 问 : 


@ Atoi 函数 的 功能 是 什么 ? 


© BH 


Ud 
dl 
Ud 


@ 写 


"dl 


将 Atoic 创建 成 静态 库 libAtoia 的 命令 序列 。 
将 Atoic 创建 成 动态 库 libAtoi so 的 命令 序列 。 


@ 编写 程序 mainc， 测 试 Atoi 函数 的 正确 性 。 给 出 main.c 代码 ， 并 分 别 写 出 采用 静态 链接 和 
动态 链接 方法 生成 可 执行 程序 main 的 命令 ， 分 别 执行 命令 ， 记 录 测 试 结果 。 


3.1.5 gcc 常用 命令 选项 及 用 法 


这 里 对 gce 常用 命令 选项 的 功能 做 一 下 总 结 。gcc 还 有 很 多 命令 选项 ， 用 于 实现 编译 控制 功能 ， 
涉及 编译 、 链 接 、 调 试 、 程 序 优化 、C 语言 标准 等 多 个 方面 ， 如 表 3-1 和 表 3-2 所 示 。 


表 3-1 编译 、 链 接 、C 语言 标准 版 本 选项 


选项 描述 
E gcc 仅 调用 cpp， 对 源 程序 做 预 处 理 ， 不 做 编译 ， 生 成 i 文件 
-S gcc 仅 执行 预 处 理 和 编译 两 个 操作 ， 生 成 s 汇编 语言 程序 
< gcc 执行 预 处 理 、 编 译 、 汇 编 三 个 操作 ， 生 成 o 目标 文件 
-0 filename 指定 输出 文件 的 名 称 
-Idir 将 dir 目录 添加 到 头 文件 搜索 路 径 中 
-Ldir 将 di 添加 到 库 文件 搜索 路 径 中 
-Iname 将 库 文件 ibname.so 或 libname.a 链接 到 可 执行 文件 中 
-static 通知 gcc 进行 静态 链接 
-shared 指示 gcc 生成 共享 库 (动态 库 ) 
-fPIC 指示 gcc 生成 位 置 无 关 代 码 ， 它 们 是 创建 动态 库 所 需 的 
-std=c99 指示 编译 器 按照 ISO C99 标准 编译 代码 , 如 允许 在 语句 块 、 for 语句 中 定义 变量 , 默认 根据 ANSI 或 ISO 

C89 编译 程序 
-std=c11 按照 ISO C11 标准 编译 程序 
表 3-2 ”调试 和 编译 优化 选项 

选项 描述 
-g 指示 gcc 在 可 执行 文件 中 包含 调试 工具 GDB 所 需 的 信息 
-0 进行 编译 优化 处 理 ， 提 高 程序 执行 效率 ， 减 少 可 执行 程序 的 大 小 
-Ol 二 级 优化 ， 编 译 时 需要 更 多 时 间 ， 也 需要 更 多 内 存 
-02 二 级 优化 ， 相 比 -O1 优化 性 能 更 高 ， 当 感觉 程序 性 能 不 够 高 时 ， 可 打开 该 选项 
-03 最 高 等 级 优化 ， 可 能 需要 更 多 编译 时 间 
-00 gcc 的 默认 选项 ， 不 进行 优化 ， 编 译 速度 快 
-Os 该 选项 对 代码 的 大 小 进行 优化 ， 使 生成 的 代码 长 度 最 短 


二 思考 与 练习 题 3.5 ”指出 以 下 编译 命令 存在 什么 错误 : 
(OM gcc-Ctestc -otets.o 


@) gcc-otests -s testc 


gcce -e testc 


@ gce libtestc -L. -lmycalc -o libtesta 
© gcc -gc testc 

© gcc-c -S test.c 

® gccc -g testc 

@® /libtesta 

@ ./libtesta 


Linux 常用 自 带 系统 库 


Linux 自 带 很 多 系统 库 文件 ， 提 供 包括 输入 输出 、 数 学 运算 、 字 符 串 处 理 、 时 间 日 期 、 环 境 控 
制 、 内 存 分 配 、 多 进程 并 发 、 数 据 结构 算法 在 内 的 很 多 系统 函数 。 与 自行 编写 代码 相 比 ， 调 用 Linux 
系统 自 带 的 库 函 数 ， 开 发 效率 、 性 能 、 可 靠 性 更 高 ， 适 用 性 更 强 。Linux 库 函 数 符合 POSIX 规范 (可 
移植 操作 系统 接口 ，Portable Operating System Interface) 中 的 API 接口 标准 了 EEE 1003， 调 用 这 些 库 
函数 开发 的 应 用 程序 可 在 支持 POSIX 规范 的 系统 中 编译 运行 ， 包 括 Windows 系统 。 

下 面 列 出 常用 的 库 函 数 ， 并 给 出 部 分 应 用 实例 供 读者 在 应 用 开发 中 查阅 。 


3.2.1 数学 函数 
Linux 系统 自 带 的 数学 函数 包括 指数 、 对 数 、 绝 对 值 、 平 方 根 、 三 角 函 数 等 常用 数学 运算 ， 其 
原型 说 明 在 头 文件 mathh 中 。 表 3-3 列 出 了 常见 的 数学 运算 函数 。 
表 3-3 常见 数学 运算 函数 


函数 名 函数 原型 


pow(x, y) 或 xy double pow(double x. double y): float powftfloat x, float y): 
long double powl(long double x. long double y): 


sqrt(x) double sqrt(double x): 


exp(x, re double exp(double x): 
log(x) double log(double x): 
float logf(float x): 
long double logl(long double x): 
log10(x) double log10(double x): 
ceil(x) long double ceil(long double x): 
double ceil(double x): 
floor(x) double floor(double x); 
float floor(float x): 
long double floor(long double x): 
fabs(x) double fabs(double x): 
float fabs(float x): 
long double fabs(long double x): 
sin、cos、tan、ctan、 double sin(double x): 
cosh、 tanh、cosh float sin(float x): 
long double sin(long double x): 
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这 些 函数 的 原型 及 所 需 头 文件 均 可 通过 man 命令 查询 ， 例 如 log 函数 ， 只 需要 在 Linux 终端 键 
入 man log， 就 可 看 到 log 函数 的 说 明和 描述 ， 其 他 库 函 数 的 原型 和 说 明 也 可 以 这 样 查 。 但 有 时 直接 
用 man 命令 查 到 的 是 一 条 Linux 命令 的 手册 ， 这 时 可 尝试 使 用 “man 2 命令 ”或 “man 3 命令 ”来 查 。 


3.2.2 ”环境 控制 函数 


Linux C 程序 可 从 运行 环境 读 取 环 境 变量 的 值 ， 甚 至 改变 环境 变量 的 值 ， 头 文件 为 stdlibh， 这 


些 函 数 如 表 3-4 所 示 。 


表 3-4 ”环境 控制 函数 


函数 名 含义 原型 
getenv | 取得 环境 变量 的 值 char *getenv(const char *name): 
更 改 环境 变量 的 值 


取消 某 个 环境 变量 i 


3.2.3 ”字符 串 处 理 函 数 


字符 串 操作 在 应 用 开发 中 的 使 用 非常 广泛 ，Linux 系统 提供 了 较为 丰富 的 字符 串 处 理 函数 ， 以 


int setenv(const char *name, const char *Value, int oVerwrite): 


方便 我 们 实现 字符 串 操作 ， 头 文件 为 sring.h， 这 些 函 数 如 表 3-5 所 示 。 
表 3-5 常见 字符 串 运算 函数 


函数 名 含义 原型 
Strcpy 复制 字符 串 char *strcpy(char *dest, const char *src); 
stmcp 复制 字符 串 的 前 n 个 字符 char *#stmcpy(char *dest, const char *src, size tn): 
bcop 复制 n 个 字 节 (过 时 ) Void bcopy(const void *src, void *dest, size tm): 
Imemcp 复制 n 个 字 节 ( 存 储 器 区 域 不 交 看 ) void *+memcpy(void *dest const void *#src, size tn): 
Strcat 字符 串 拼接 char *strcat(char *dest char *src): 
strcmp 比较 两 个 字符 串 是 否 相同 int strcmp(const char *s1. const char #s2): 
stmcmp 比较 两 个 字符 串 的 前 n 个 字符 是 否 相同 int stmcmp(const char *s1. const char *s2, size_tD): 
strcasecmp 将 一 个 串 与 另 一 个 串 做 比较 . 不 区 分 大 小 写 int strcasecmp(char *str1. char *str2): 
stmcasecmp 将 一 个 串 中 的 一 部 分 与 另 一 个 串 做 比较 ， 不 区 | int stmcasecmp(char *str1. char *str2, size_t n); 
分 大 小 写 

bzero 存储 器 块 各 字 节 初始 化 为 0 void bzero(void *s. size tm) 
memset 存储 器 块 各 字 节 初始 化 为 字符 c void *+memset(void *s., int c. size tn): 
index、strchr 在 字符 串 中 查找 指定 字符 第 一 次 出 现 (index) 及 | char *index(char *str, char c): 
Tindex、stmchr | 最 后 一 次 出 现 (rindex) 情 况 char *rindex(char *str, char ©): 

char *strchr(const char *s. int ¢): 

char *strrchr(const char *s. int ©): 
memchr 在 内 存 块 中 扫描 指定 字符 ， 返 回 第 一 次 或 最 后 | void *memchr(const void *s. int c. size_tn); 
memrchr 一 次 出 现时 的 指针 void *memrchr(const void *s. int ¢. size tn); 


( 续 表 ) 
函数 名 含义 原型 
strstr 在 字符 串 中 查找 指定 字符 串 的 第 一 次 出 现 的 位 | char *strstr(char *strl, char *str2); 
置 ， 成 功 时 返回 子 串 指针 ， 和 否则 返回 NULL 
strcasestr 在 字符 串 中 查找 指定 字符 串 的 第 一 次 出 现 情 | char *strcasestr(const char *sl1, const char *s2); 
况 ， 忽 略 大 小 写 
strtok 分 解 一 个 字符 串 为 一 组 字符 串 ，s 为 要 分 解 的 | char *strtok(char s[], char delim); 


字符 串 ，delim 为 分 隔 符 ，s 中 包含 的 分 隔 符 会 
被 蔡 换 为 "0 字符 。 第 一 次 调用 时 ，strtok 函数 
必须 提供 参数 s， 之 后 的 调用 将 参数 s 设置 为 
NULL。 每 次 调用 成 功 时， 返回 指向 下 一 个 被 


分 隔 出 的 子 串 的 指针 
stru 将 字符 串 中 的 小 写字 母 转换 为 大 写字 母 char* char *str) 
atoi 将 字符 串 转换 为 整 型 atoi (char *str): 
strtol 将 字符 串 转换 为 长 整数 long strtol(char *str, char **endptr, int base) 
strtod 将 字符 串 转换 为 double 型 double strtod(char *str, char **endptr): 
3.2.4 ”时间 函数 


在 应 用 开发 中 ， 有 时 需要 执行 时 间 测量 、 系 统 时 间 获 取 等 操作 。Linux 提供 了 较为 丰富 的 时 间 
函数 以 供 使 用 ， 头 文件 是 sys/time.h， 表 3-6 列 出 了 几 个 常用 的 时 间 函 数 。 


表 3-6 常用 的 时 间 函 数 


函数 名 含义 算法 说 明 
time 取得 整数 类 型 | time ttime(time t*b; 返回 值 从 1970 年 1 月 1 日 0 时 0 分 0 秒 到 目 
的 系统 时 间 前 经 过 的 秒 数 ， 若 参数 t 非 空 ， 将 返回 值 同时 存 


入 t 指 向 的 内 存单 元 
ctime 取得 字符 串 类 | char *ctime(consttime t*timep): | 将 time 函数 获得 的 时 间 转 换 成 形 如 "Wed Jun 30 
型 的 当前 时 间 21:49:08 1993\" 的 字符 串 
返回 值 ;日 期 时 间 字符 串 
gettimeofday | 取得 当前 时 间 ， | int gettimeofday( 参数 tz 为 时 区 ， 一 般 可 设 为 NULL。tv 为 当前 时 
精确 到 微 秒 struct timeval*tv, 间 ， 结 构 为 : 
struct timezone *tz): struct timeval{ 

long int tv_sec:; // 秒 数 
long int tv_usec: // 微 秒 数 
} 

在 代码 前 后 分 别 调用 time 或 gettimeofday 函数 ， 将 两 次 调用 得 到 的 时 间 相 减 ， 就 可 算出 某 段 代 
码 的 执行 时 间 。 

下 面 的 mtime.c 是 应 用 time 函数 测量 代码 执行 时 间 的 一 个 示例 : 

#include <stdioh> 

#include <timeh> 

int main(void) 


Lr 
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time ttl,t: 
t1 =time(&t]): 


Printf("t1=%lldn", (long long)t1): 


刀 =time(&tD): 
sleep(1); 


Printf"t2-t1=%d\n",(int)(t2-t1)); 


片 世 实际 上 是 一 个 64 位 整数 ， 输 出 显示 */ 


上 # 需要 强制 转换 为 long long 类 型 ， 同 时 格式 串 应 为 ld */ 


Printf("current time is %s",ctime(&t1)): 上 庆 打印 当前 时 间 */ 


} 


现在 编译 和 执行 程序 : 


Sgce mfimel.c -0 mtime 


S$ /mtime 
t1=1469939008 
t2-t1=0 


current time is Sat Jul 30 21:23:28 2016 
史 ” 思考 与 练习 题 3.6 写 一 个 程序 ， 调 用 gettimeofday 来 测量 pow、sqrt、sin、log 等 函数 的 执行 
时 间 ， 用 同一 输入 数据 进行 测试 ， 并 用 相关 数学 知识 对 运行 时 间 的 差异 进行 解释 。 


3.2.5 ”数据 结构 算法 函数 


Linux 系统 也 把 搜索 、 排 序 、 哈 希 表 、 二 又 树 等 常见 算法 做 成 系统 库 函 数 ， 供 开发 人 员 直 接 调 
用 ， 提 高 开发 效率 ， 头 文件 为 stdlib.h 或 search h。 这 些 系统 函数 处 理 的 序列 或 二 叉 树 ， 其 元 素 类 型 
不 限于 整数 ， 而 可 以 是 任何 能 进行 大 小 比较 的 对 象 ， 大 小 判别 标准 由 调用 者 以 函数 指针 方式 给 出 。 
表 3-7 列 出 了 针对 序列 或 数组 进行 排序 和 搜索 的 库 函 数 : 


表 3-7 ”排序 与 搜索 库 函数 


上 # 输出 time 函数 两 次 调用 之 间 代 码 的 执行 时 间 */ 


函数 名 含义 原型 算法 说 明 
bsearch 对 已 排序 序 | void *bsearch(const void #key. 参数 : 
列 执行 二 分 | const void *base. 。 nmemb: 已 排序 序列 的 元 素 个 数 
搜索 size_ tnmemb. size_ tsize. e base: 序列 首 地 址 指针 
int(*compar)(const void *, const void *)); e size: 每 个 序列 成 员 占 据 字 节 数 
。 compar: 序列 成 员 比较 函数 指针 ， 若 第 1 个 
参数 小 于 (等 于 、 大 于 ) 第 2 个 参数 ， 则 返回 值 
小 于 0( 等 于 0、 大 于 0) 
e 返回 值 : 成 功 则 返回 与 关键 字 key 匹配 的 成 
员 指针 ， 否 则 返回 NULL 
lfind 线性 搜索 void *]find(const void *key, 参数 : 


const void *base. size_t*#nmemb. size_t size, 


int(*compar)(const void *, const void *)); 


e base: 序列 首 地 址 指针 

e nmemb: 序列 长 度 指针 

e size: 每 个 序列 成 员 的 字 节 长 度 

。 compar: 序列 成 员 比 较 函 数 指针 

。 返回 : 成 功 则 返回 与 key 匹配 的 成 员 指针 ， 
失败 则 返回 NULL 


( 续 表 ) 
函数 名 含义 原型 算法 说 明 
Jsearch 线性 搜索 void 9jsearch(const void *key. 参数 : 
void *base, e nmemb: 已 排序 序列 的 元 素 个 数 
size_t *nmemb, e base: 序列 首 地 址 指针 
size t size, 。 size: 每 个 序列 成 员 占 据 字 节 数 


。 compar: 序列 成 员 比较 函数 指针 

。 返回 值 ; 成 功 则 返回 与 key 匹配 的 成 员 指针 ， 
否则 将 key 作为 新 成 员 附加 到 序列 末尾 ， 
*nmemb 递增 1， 返 回 新 成 员 指针 


int(*compar)(const void *, const void *)): 


qsort 快速 排序 void qsort(void *base, 参数 : 
size t nmemb, e nmemb: 己 排 序 序 列 的 元 素 个 数 
size t size, e base: 序列 首 地 址 指针 


e size: 每 个 序列 成 员 占据 字 节 数 
e compar: 序列 成 员 比较 函数 指针 
e 返回 值 ， 非 零 值 


int(*compar)(const void *, const void *)): 


下 面 的 程序 qsorttest.c 调用 qsort 函数 ， 对 整 型 数组 int num[10]= {90,51,32,83,94,45,36,47,28,19} 
进行 排序 。 
#include <stdioh> 
#include <stdlib.h> 
int compare(const void *n1, const void *n2) 
{ 
Tetum (*(int *)n1 - *(int *)n2); 
} 
int main() 
{ 
int num[10]={90,51,32,83,94.45, 36,47,28.19}: 
qsort((void *)num., 10, sizeoftnum[0]). compare): 
for(i=0:1<10:i++) 
Printf("%d "num[i]: 
Printf"\n"); 
} 
现在 编译 执行 该 程序 : 
Sgcc -0 gsorttest qsorttestc 
S$ /qsorttest 
19.28.32.36.45.47.51.83.90.94 


和 思考 与 练习 题 3.7 写 一 个 程序 ,调用 qsort 函数 ,对 浮 点 型 数组 int num[10]={90.9, 51.8, 32.7， 
83.6, 94.5, 45.4, 36.3, 47.2,28.1,19.0} 进 行 排序 ， 运 行程 序 以 验证 其 正确 性 。 

考虑 到 二 叉 树 在 应 用 开发 中 用 得 很 多 ，Linux 系统 将 二 叉 树 的 建树 、 搜 索 、 遍 历 、 删 除 等 操作 
做 成 库 函 数 ， 以 方便 我 们 开发 应 用 。 表 3-8 列 出 了 常见 的 二 又 树 操作 函数 。 


Lz 
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表 3-8 常见 的 二 叉 树 操作 函数 


函数 名 含义 原型 算法 说 明 
tsearch 二 叉 树 检 void *tsearch(const void *key. 参数 
索 和 建树 void**rootp, e rootp: 指向 二 叉 树 树 根 指针 的 指针 , 若 二 叉 树 为 
int(*compar)(const void *. const void *)): 空 ， 则 rootp 应 该 是 空 指针 
。 key: 关键 字 
。 compar: 二 又 树 成 员 大 小 比较 函数 
e 返回 值 : 若 找到 匹配 成 员 , 则 返回 匹配 成 员 指 针 ， 
否则 将 key 插入 二 叉 树 ， 返 回 新 插入 成 员 指针 
tfind 二 叉 树 void *tfind(const void *key, 参数 
检索 void **rootp, e rootp: 指向 二 叉 树 树 根 指针 的 指针 
int(*compar)(const void *, const void *)); | e key: 关键 字 
e compar: 二 叉 树 成 员 大 小 比较 函数 
。 返回 值 : 若 找到 匹配 节点 , 则 返回 匹配 节点 指针 ， 
否则 返回 NULL 
twalk 二 叉 树 void twalk(const void *root. 参数 
遍历 void(*action)( e root: 指向 某 个 树 节点 的 指针 ， 如 果 root 不 是 树 
const void fnodep、 根 ， 则 指向 以 root 为 树 根 的 子 树 
const VISIT which., e action: 遍历 操作 函数 
const int depth)); e action: 遍历 到 每 个 节点 时 的 处 理 函数 
e nodep: 被 遍历 节点 指针 
e which: 遍历 节点 的 时 机 ， 有 四 个 值 。reorder 为 
遍历 子 节点 前 (前 序 )，postorder 为 遍历 第 一 个 子 
节点 后 和 第 二 个 子 节点 前 (中 序 ), endorder 为 遍历 
两 个 子 节点 后 (后 序 ), leaf 以 当前 遍历 节点 为 页 节 
点 
e_depth: 当前 遍历 的 深度 
tdelete 删除 二 叉 void *tdelete(const void *key, 参数 
树 节点 void **rootp, e key: 待 删除 节点 关键 字 
int(*compar)(const void *, const void *)); | e compar: 比较 函数 
e rootp: 指向 树 根 节点 指针 的 指针 
。 返回 值 ， 删 除 成 功 返回 父 节点 指针 ， 否 则 返回 
NULL 
tdestroy 清除 整个 void tdestroy(void *root. 参数 : 
二 叉 树 void(*free_node)(void *+nodep)): e root: 树 根 节点 指针 
。 fiee_node: 清除 某 个 节点 的 操作 函数 
下 面 的 示例 程序 bintree.c 演示 了 二 又 树 库 函 数 的 使 用 方法 , 它 将 12 个 随机 数 插入 二 叉 树 , 然后 
进行 中 序 遍 历 ， 按 顺序 输出 各 个 数 。 
#include <search h> 
#include <stdlib.h> 
#include <stdioh> 
#include <time.h> 


void *r00t = NULL; 语 二 叉 树 初始 为 空 树 */ 
void * xmalloc(unsigned n) 
{ void*p; 
Pp =malloc(n): 
if(p) retum p: 
fprintftstderr, "insufficient memory\n"): 
exit(EXIT FAILURE): 
} 
int compare(const void *pa, const void *pb) ” /* 节点 大 小 比较 函数 */ 
L 
f(*(int *) pa < *(int *) pb) 
Tetum -1; 
(YGint *) pa> *(int *) pb) 
Tetum 1; 
Tetum 0; 
} 
Void action(const void *nodep. const VISIT which, const int depth) 
{ 
int *datap; 
switch (which) { 
case 
break: 
case postorder: 必 在 两 个 子 节点 中 间 处 理 父 节点 ， 为 中 序 遍 历 */ 
datap = *(int **) nodep: 
printf("%%6d\n", *datap): 
break: 
case endorder: 
break: 
case leaf: 上 # 叶子 节点 只 有 一 次 遍历 机 会 对 
datap = *(int **) nodep; 
Printf("%6dn", *datap): 
break: 
} 


} 
int main(void) 
inti *ptr:void *+val; 
srand(time(NULL)): 
for(i=0:1<12:1H) { 
ptr = xmalloc(sizeof(int)): 
*ptr =randO & 0xF 
val = tsearch((void *) ptr, &root, compare); 
ff(val — NULL) 
exit(EXIT FAILURE): 
clse if (Cint **) vaD (= pt) 
free(ptr): 
} 
twalk(root, action); 
tdestroy(root, free); 
exit(EXIT_SUCCESS):; 


Lz 
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诊断 和 处 理 Linux 编程 错误 


在 编写 程序 时 ,很 少 能 够 一 次 就 使 得 程序 完美 , 经 常会 出 现 各 种 错误 , 一般 有 两 种 类 型 的 错误 : 

。 一 类 是 编译 错误 。 编 译 错误 是 编译 链接 过 程 中 报 出 的 错误 ， 存 在 语法 错误 或 未 定义 函数 的 

程序 在 编译 或 链接 时 会 失败 ，gce 报 出 “error” 等 级 的 错误 ， 不 产生 目标 代码 程序 和 可 执行 
程序 ， 应 根据 错误 描述 诊断 和 排除 所 有 编译 错误 。 

。 另 一 类 是 运行 错误 。 运 行 错误 包括 程序 运行 结果 不 正确 和 程序 运行 衣 溃 两 种 ， 诊 断 和 排 错 
往往 困难 很 多 ， 有 时 可 通过 阅读 源码 、 配 合 调 试 信息 来 排 错 ， 但 由 程序 算法 逻辑 问题 引起 
的 错误 往往 需要 借助 专门 的 调试 工具 gdb 来 诊断 ， 编 码 时 也 应 主动 进行 错误 检查 ， 尽 早 将 
出 错 信息 报告 出 来 。 


3.3.1 诊断 和 处 理 编译 错误 

Linux C/C++ 程 序 如 果 在 编译 过 程 中 没有 错误 ，gcc 编译 命令 在 执行 结束 后 是 没有 任何 输出 的 ， 
下 一 行 直接 显示 命令 提示 符 ， 就 像 编译 如 下 最 简单 的 C 语言 程序 后 得 到 的 结果 ; 

Scat simple.c 

void mainO 全 

Sgce -0 simple simple.c 

$ 


Linux 环境 下 常见 编译 错误 和 警告 的 诊断 及 排 错 方法 如 表 3-9 所 示 。 
表 3-9 Linux 环境 下 常见 编译 错误 和 警告 的 诊断 及 排 错 方法 


常见 的 出 错 原 因 诊 断 及 排 错 方法 
第 一 类 ; 变量 无 定义 


mainO{ testc:2: error: ‘pid tf” undeclared(first 错误 诊断 : 类 型 、 函 数 或 变量 无 定义 ， 
pid tpid; use in this function) 可 能 是 缺少 头 文件 ， 遗 漏 变量 定义 。 
testc:3: error: ‘x” undeclared(first use 排 错 方法 : 增加 相应 的 头 文件 。 
in this function) 
mainO{ testc:3: error: fun undeclared(first use 错误 诊断 : 函数 调用 在 前 ， 定 义 在 后 。 
void (*fn)(int a); in this function) 排 错 方法 : 将 fun 函数 的 定义 移 到 main 
fh=fim: 函数 的 前 面 ， 或 在 调用 前 增加 函数 声 
} 明 ， 再 编译 就 不 会 报错 了 。 
void fn(int a) { } void fan(inta) {} | void fanGinta): 
mainO{ mainO{ 


void (*fh)(int a): void (*fn)(int a); 
fh=fiun; fn=fim; 
} } 
void fun(int a) { } 


( 续 表 ) 
程序 实例 错误 提示 等 级 常见 的 出 错 原因 诊断 及 排 错 方法 
第 二 类 ,变量 重复 定义 
mainO{ testc:3: error: conflicting types for 宁 错误 诊断 : 同一 变量 在 多 处 定义 。 
inti; 排 错 方法 : 仅 留 一 处 定义 即 可 。 
char jj: 
} 
$cattestc S$ gcctestc 错误 诊断 : 同一 函数 在 多 处 定义 。 
mainO{} test.c:2: error: redefinition of “main” 排 错 方法 : 仅 留 一 处 定义 即 可 。 
mainOO 
mainO{ testc:3: error: redeclaration of ‘p* with | error | 错误 诊断 : 同一 变量 在 多 处 定义 。 
int #pi; 排 错 方法 : 仅 留 一 处 定义 即 可 。 
int *p=(void*)&i: 


第 三 类 : 缺少 表达 符号 ， 括 号 、else 不 匹配 等 


mainO{ test.c:1:4: error: expected ‘;” before testc 程序 的 第 4 行 ，strcat 前 缺 “;:”, 可 
char stf100]: int i: “strcat 能 漏 写 某 条 语句 后 的 分 号 。 


i=5 
strcat(str,"abcd"): 


mainO{ test.c:4: error: expected 小 before “: test c 程序 的 第 4 行 ,“” 字符 前 缺少 9"。 
char str[100]; int i; token 
ES 
strcat(str,"abcd"; 
} 
mainO{ #else after #else; #elif without 区 if #else 出 现在 #else 后 ，#elif 没有 匹配 的 
i DO #f, 
else {} 
elseO 
第 四 类 : 找 不 到 文件 
S$ cat test.c S$ gcc test.c error | testc 程序 的 第 1 行 ， 没 有 my.h 这 样 的 
#include "my.h" test.c:1: fatal error: myh: No such file 文件 ， 可 能 是 文件 名 写 错 。 
mainOf} or directory 
compilation terminated. 
#include < stdioh> S$ gcc test.c error | testc 程序 的 第 1 行 ， 文件 名 stdioh 的 
mainOf} test.c:1: fatal error: stdio.h: No such file 前 面 多 了 一 个 空格 ， 该 行 如 果 写 成 
or directory #include < stdioh>, 也 会 报告 同样 的 错误 
compilation terminated. 
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程序 实例 


错误 提示 


( 续 表 ) 
常见 的 出 错 原因 诊断 及 排 错 方法 


第 五 类 : 非法 中 文 全 角 字 符 、 标 点 符号 、 括 号 


mainO{ 
char str[100]; 


int ii; 


test.c:2: error: stray “357" in program 
test.c:2: error: stray “274’ in program 
test.c:2: error: stray 233’ in program 
test.c:3: error: stray “357" in program 
test.c:3: error: stray “275° in program 
test.c:3: error: stray "211” in program 

- “in program 


test.c:4: error: stray “200’ in program 


emor | Qtestc 程序 的 第 2 行 , 语句 后 为 中 文 分 


号 “;:”， 应 改 为 英文 分 号 ， 除 字符 串 内 
容 外 ， 程 序 中 所 有 的 标点 符号 ， 包 括 逗 
号 、 括 号 、 引 号 、 分 号 ， 都 必须 是 英文 
标点 符号 。 

@ testc 程序 的 第 3 行 , 变量 i 写成 了 全 
角 中 文字 符 i ， 应 改 成 半角 英文 字符 i。 
@ testc 程序 的 第 3 行 ， 有 一 个 中 文 全 
角 空 格 字符 ， 用 鼠标 选择 文本 后 就 可 以 
发 现 ， 应 删除 该 全 角 字 符 。 


第 六 类 : 链接 阶段 找 不 到 库 文件 
#include “wrapper.h" 
intmain0) 
{ 
char c; 
int in , out; 
in =open("file.in", 
O_RDONLY.0); 
out= Open( "file.out", 
O_WRONLY|O_CREAT.0666): 
while(read(in,&c.1) =—= 1) 
write(out , &c , 1 ); 
close(in): 
close(out): 
exit (0) ; 


#include “wrapper.h" 


void *thread(void *vargp); 
int main0 
{ pthread ttid: 
pthread_create(&tid, NULL. 
thread, NULL): 
exit(0); 
} 
void *thread(void *vargp) 
《 
sleep(1): 
Printf("Hello, world\n"); 
retum NULL: 
} 


$egccfcopyl.c-o fcopyl 
/tmp/ccWK8DE4.o: In function "main ': 
fopyl.c:(textHOx21): undefined 
Teference to "Open' 
fcopyl.c:(.text+0x41): undefined 
Teference to "Open' 
fcopyl.c:(.text+0x63): undefined 
Teference to Write 
fcopyl.c:(.text+Ox7f): undefined 
Teference to Read' 
fcopyl.c:(.text+Ox90): undefined 
Teference to “Close’ 
fcopyl.c:(.text+Ox9c): undefined 
Teference to “Close’ 

collect?2: error: ld retumed 1 exit status 


$gcc -0 hellobug hellobugc -L. 


-wrapper 

happ.c:(.text+0x22): undefined 
Teference to ‘pthread_create’ 
Jibwrappera(thapp.o)j: In function 
‘pthread_cancel': 
thapp.c:(.text+0x51): undefined 
Teference to ‘pthread_cancel' 
.libwrappera(thapp.o): In function 
"pthread join 
thapp.c:(.text+0x87): undefined 
Teferenceto pthread join' 
.Hibwrappera(thapp.o): In function 
pthread_detach': 
thapp.c:(.text+Oxb6): undefined 
Teference to -pthread detach' 
.Hibwrappera(thapp.o): In function 
pthread_once': 


错误 诊断 : Open、Close、Write、Read 

等 函数 实现 在 库 文件 libwrapper.a 中 ， 

应 该 用 两 个 选项 将 该 库 链 接 到 可 执行 

程序 fcopyl。 

排 错 方法 : 将 编译 命令 改 为 
Sgccfcopyl.c-o fcopyl -I. 

-wrapper 


错误 诊断 : 程序 调用 pthread 线程 库 函 
数 ， 必 须 在 编译 命令 中 显 式 地 将 函数 库 
libpthread so 链接 到 可 执行 程序 。 
排 错 方法 : 将 编译 命令 改 为 : 

S$ gcc -ohellobug hellobug.c -L. 
-lwrapper -lpthread 


( 续 表 ) 
程序 实例 错误 提示 常见 的 出 错 原因 诊断 及 排 错 方法 
S$ cattest.c S$ gcc -ctestc @ 第 1 条 命令 : 用 带 -c 选项 的 gcc 命令 
#include <stdio.h> S$ gcc -0 test test.c 编译 通过 ， 可 生成 目标 文件 test.o, 表 
void *fh(void *arg){ } test.c:(.text+Ox1e): undefined reference 明 在 编译 阶段 允许 程序 调用 未 定义 的 
main0{ to ‘fin 函数 。 
int tid; test.c:(.text+Ox65): undefined reference @ 第 1 和 第 2 条 命令 ,用 不 带 -c 选项 的 
fun0: to "pthread_ create' gcc 命令 进行 编译 链接 ， 失 败 ， 因 为 
pthread_create(&tid, NULIL. S$ gcc -0 testtest.c -lpthread testc 中 调用 的 函数 (fun.pthread_create) 
fh, NULD): 无 定义 , 链接 阶段 需要 找到 这 两 个 函数 
} 的 实现 代码 , 才能 生成 可 执行 程序 。 解 


第 七 类 : 编译 警告 (warning) 


一 般 不 影响 生成 可 执行 程序 ， 也 不 影响 程序 的 执行 ， 但 排除 警告 是 一 种 好 的 编程 习惯 。 


决 方法 : 在 程序 中 给 出 函数 的 实现 代码 
(如 fun)， 或 用 -1 指明 函数 定义 所 在 的 
库 文 件 (如 线程 库 文件 libpthread.so 需 
要 用 -lpthread 表示 )。 

轿 第 4 条 命令 ， 在 编译 命令 中 增加 
-jpthread 选项 ，gcc 从 libpthread.so 中 
找到 pthread_create 函数 的 实现 ， 成 功 
地 生成 可 执行 文件 。 


S$ cattest.c $cattest2.c S$ gcc test.c 第 2 行 : 对 fun 函数 未 做 类 型 声明 便 调 
mainO{ void fhnd0 全 test.c:4: waming: conflicting types for 用 , gec 认为 返回 值 类 型 为 nb 发 出 警告 。 
fun0: mainO{ ‘fan’ 第 4 行 ， fan 函数 的 实际 返回 类 型 为 
} funO; test.c:2: note: previous implicit void， 与 第 2 行 所 做 的 假定 冲突 
void funOf} } declaration of ‘fun’ was here 
Scattestl.c 消除 方法 : 在 函数 调用 前 给 出 函数 定义 
void funO; S$ gcctestl.c 或 声明 ， 参 见 testl.c 和 test2。 
mainO{ Sgcctes2.c 
funO: $ 
} 
void fnO{} 

S$ cat test.c $ gcc test.c strlen 是 一 个 内 建 库 函 数 ， 应 给 出 包含 
mainO{ test.c:2: waming: incompatible implicit 其 声明 的 头 文件 ， 可 用 man strlen 查找 
strlen("abcd"): declaration of built-in fnction ‘strlen” strlen 函数 是 在 哪个 头 文件 中 声明 的 ， 

} 参见 testl.c。 
Scattestl.c S$ gcctestl.c 
#include <string.h> $ 
mainO{ 
strlen("abcd"): 
} 
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如 果 gce 显示 出 错 信息 ， 通 常 表明 程序 中 存在 错误 。 在 编译 链接 过 程 中 报 出 的 错误 又 分 两 种 : 
一 种 称 为 错误 (“error”)， 一 般 是 程序 中 存在 语法 问题 ， 常 见 原因 包括 变量 无 定义 、 标 识 符 拼写 错 、 
漏 写 标 点 符号 、 括号 不 匹配 、 存在 全 角 中 文字 符 、 引 用 的 函数 无 定义 等 , 编译 过 程 中 只 要 出 现 “error” 
错误 ， 编 译 过 程 将 很 快 终止 ， 不 会 产生 可 执行 程序 。 另 一 种 称 为 警告 (“waming”)， 表 示 程 序 可 能 
不 符合 某 种 规范 ， 如 函数 调用 前 未 做 声明 、 程 序 没有 换行 符 、 缺 少 必 要 的 包含 文件 、 缺 少 必要 的 强 
制 类 型 转换 等 ， 这 种 错误 不 影响 产生 可 执行 程序 ， 但 可 能 导致 程序 运行 错误 。 每 个 错误 提示 行 一 般 
包括 冒号 (:) 分 隔 的 三 个 字段 ， 分 别 为 出 错 的 源 程序 文件 名 、 出 错 行 号 、 错 误 描述 。 一 般 根 据 错误 提 
示 ， 打 开源 程序 ， 找 到 出 错 行 ， 就 能 发 现 出 错 原因 ， 可 据 此 修改 程序 ， 排 除 错误 。 有 些 错 误 不 太 容 
易 诊 断 ， 前 面 的 表 3-9 对 初学 者 经 常 遇 到 但 较 难 找到 出 错 原因 的 常见 错误 给 出 了 出 错 原因 诊断 ， 供 
读者 参考 。 
gb 思考 与 练习 题 3.8 ”假设 有 两 个 源 程序 pl.c 和 p2.c 的 内 容 都 是 “void main0 和 ”为 何 命令 “gcc 
pl.cp2.c” 执 行 时 会 报错 ? 
守 思考 与 练习 题 3.9 ”假设 有 四 个 源 程序 文件 ， 内 容 如 下 : 


comm.h main.c 

int coefl=2, coef2=2; #include "comm.h" 

int scaleup(in); void main0 

int scaledown(int); 
intn; 
scanf("%d",&n) 
n=scaleup(n); 
n=scaledown(n): 
Printf("n=%d",n): 


(1) 执行 命令 “gcc plc p2.c mainc -omain” 将 报告 什么 错误 ， 为 什么 ? 

(2) 如 何 修改 程序 以 消除 错误 ? 

(3) 多 个 源 程序 文件 都 要 引用 的 全 局 变量 如 何 定义 和 声明 比较 好 ? 
”思考 与 练习 题 3.10 ”参考 表 3-9, 给 出 以 下 源 程序 的 编译 出 错 原因 ,如 何 消除 error 错误 和 waming 
错误 ? 

(1) p3.c 的 内 容 : 

#include <stdioh > 

int mainO{} 

$8cce p3.c 

p3.c:1: fatal error: stdioh : No such file or directory 

compilation terminated. 

(2) p4.c 的 内 容 : 

#include <stdioh> 

intmain0 {exit(0):} 

S$8cce p4.c 

p4.c: In function "main 

Pp4.c:2: waming: incompatible implicit declaration of built-in function “exit* 


(3) 库 函 数 pthread_create 的 定义 在 系统 库 libpthread.so 中 ，p5.c 的 内 容 为 : 


#include <pthread h> 
#include <unistd h> 
void *thread(void *vargp) 全 
intmain0 { 
pthread ttid: 
pthread _create(&tid NULL, thread NULI): 
} 
Sgce pi.c 
/tmp/cc799hQ7.o: In function main : 
Pp3.c:(textHOx2ej: Undefined reference to -pthread _ create 
collect?2: ld retumed 1 exit status 


(4) 假设 函数 Fork 所 在 的 库 文件 libwrapper.a 位 于 当前 目录 下 ， 源 程序 p6.c 的 内 容 为 : 


#include "wrapper.h" 
int mainO{ 
Fork0: 
} 
Sgce ph.c 
/tmp/ccidGV2n.0: In function main : 
pS5.c:(.text+Ox7): undefined reference to ‘Fork™ 
collect2: ld retumed 1 exit status 


3.3.2 ”处 理 系统 调用 失败 


Linux 系统 环境 下 的 很 多 库 函 数 属于 系统 调用 ， 如 open、close、write、read、fork， 它 们 的 功能 
是 由 操作 系统 内 核实 现 的 。 很 多 时 候 ， 参 数 不 正 确 、 执 行 权限 不 够 都 可 能 导致 系统 调用 失败 ， 但 程 
序 还 能 继续 执行 , 也 无 任何 输出 , 只 是 结果 不 正确 。 看 下 面 显示 文件 1.txt 前 10 个 字符 的 程序 testl.c: 


1  #include <stdioh> 
2  #include <fcntlh> 
3 voidmain0 
| 

5 int fd,fdl,i; 
6 char c:; 

7 fd=open("l.txt", O_RDONLY): 
8 for(i=0:i<10:i++) 

9 { 

10 Tead(fd1, &c, 1):; 

11 write(], &c ,1): 

12 } 

13 


编译 和 运行 结果 如 下 : 
Sgce -0 festl testl.c 

Scat 了 tt 

cat: 1.txt No such file or directory 


S$ /est1 
$ 


该 程序 虽然 没有 语法 错误 , 且 编 译 通过 ,但 却 是 有 问题 的 :第 7 行 , open 函数 要 打开 的 文件 “1.txt” 


LL so 
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不 存在 ; 第 10 行 ， 调 用 read 函数 读 文件 ， 
数 执行 都 失败 了 ， 却 没有 报告 错误 。 


第 1 个 参数 本 来 是 弓 ， 但 误 写 成 弓 1。 这 两 个 系统 调用 函 


现在 创建 文件 1.txt， 并 输入 内 容 ABCDEFGHUK， 运 行 该 程序 : 


Scat 了 tt 
ABCDEFGHUK 
S$ /estI 

5 


仍然 没有 输出 结果 ， 也 没有 显示 错误 。 这 种 情况 给 新 手 排 错 带 来 极 大 困难 。 


其 实 ，Linux 系统 一 般 通 过 函数 的 返 
值 一 般 为 0 或 大 于 0， 失 败 时 返回 


-1; 如 果 系 统 调用 函数 失败 ， 全 局 整数 变量 ermo 给 出 出 错 原因 
编码 ，strerror(erno) 或 perror 函数 给 出 出 错 原因 描述 。 


回 值 来 告知 系统 调用 函数 执行 是 否 成 功 ， 执 行 成 功 时 返回 


因此 ， 要 想 知 道 程序 执行 到 何 处 出 错 了 ， 应 


回 值 进行 检查 ， 并 打印 出 错 信 息 。 将 testl.c 按 如 下 方式 改 成 test2.c: 


该 对 所 有 系统 调用 函数 的 返 
1  #include <stdioh> 
2  #include <fcntlh> 
3 voidmain0 
人 
5 int fd,fdl iret: 
6 charc:; 
7 fd=open("2.txt",O_RDONLY.,0): 
8 这 从 一 1) { 
9 fprintf(stderr, "file open error: %s\n", strerror(ermo)): 
10 } 
11 
bp for(i=0:i<10:i++) 
13 { 
14 Tet=read(fd]1, &c, 1); 
15 iftret—-1) { 
16 fprintf(stderr, "file read error: %s\n", strerror(ermo)) 
17 } 
18 Write(l, &c ,1); 
19 } 
207 1 


第 9 和 第 16 行将 出 错 信 息 输出 到 标准 错误 输出 对 应 的 文件 流 stderr， 现 在 ， 分 别 在 创建 2.txt 


前 后 运行 该 程序 测试 一 下 : 
Sgcec -0 test? fest2.c 
Scat 2.txt 
cat: 2.txt: No such file or directory 
S$ /est? 
file open error: No such file or directory 
file read error: Bad file descriptor 
S$ cp /etcpassword 2.txt 
S$ /est? 
file read error: Bad file descriptor 


结果 每 个 失败 的 系统 函数 调用 都 显示 了 出 错 信 息 ， 我 们 很 容易 诊断 出 错误 原因 。 


但 是 这 种 在 程序 中 加 入 大 量 错误 判断 语句 的 方法 有 两 个 问题 : 一 是 增加 太 多 错误 检测 语句 ， 影 
响 程 序 的 可 读 性 ， 也 会 干扰 编程 思维 ;二 是 不 规范 ， 相 同 的 错误 显示 的 错误 提示 可 能 不 同 ， 同 时 出 
错 信息 应 该 在 标准 错误 输出 中 显示 。 

对 系统 调用 执行 情况 进行 检查 的 一 种 比较 好 的 方法 是 : 对 每 个 这 样 的 系统 函数 (如 read、write、 
open、 close、 fork、 pthread_create 等), 编写 一 个 增加 了 错误 处 理 功 能 的 包装 函数 (error-handling wrapper)。 
我 们 对 数 十 个 常用 的 系统 调用 函数 进行 错误 处 理 包 装 ， 统 一 命名 成 与 原 函 数 名 相同 、 参 数 表 相同 、 
返回 值 相同 但 首 字 母 为 大 写 的 函数 ， 这 样 既 解 决 了 错误 检测 问题 ， 又 方便 使 用 。 下 面 是 open 和 read 
函数 的 包装 函数 ， 包 装 函 数 名 与 原 函 数 名 相同 ， 仅 首 字 母 变 成 大 小 ， 便 于 记忆 。 包 装 函 数 将 返回 值 赋 
给 变量 ze， 如 果 re<1， 就 表明 函数 调用 执行 失败 ， 调 用 Perror 函数 报告 错误 ， 并 终止 进程 。 

int Open(const char *pathname, int flags, mode tmode) 

int re; 

f(rc = open(pathname, flags, mode)) <0) 
Perror("open error"); 
retum re; 
bh 


ssize t Read(int fd, void *buf size t count) 
ssize t Ic; 
if((rc=7read(fd, buf count)) <0) 
perror("read error"); 
Tetum rc; 


} 


void Perror( const char * str ) 
{ 

perror(str); 

exit(1); 

} 

Perror 函数 声明 是 “void Perror( const char * str );”， 用 来 将 上 一 个 系统 调用 函数 执行 失败 的 错 
误 原因 写 到 标准 错误 输出 。 参 数 str 所 指 的 字符 串 会 先 被 打印 出 来 , 后 面 加 上 错误 原因 字符 串 。 系统 
调用 函数 执行 失败 时 ， 出 错 编码 记录 在 全 局 变量 emmo 中 。 

除 文件 VO 外 ， 我 们 还 对 进程 控制 、 线 程控 制 、 网 络 编程 的 很 多 API 函数 进行 了 包装 。 所 有 包 
装 函 数 的 声明 保存 在 头 文件 wrapperh 中 ， 包 装 函数 保存 在 两 个 C 程序 文件 wrapper.c 和 ptwrapper 
中 ， 并 创建 成 库 文件 libwrapper.a。 为 解决 用 户 在 源 代码 中 加 入 一 大 堆 系 统 头 文件 带 来 的 不 便 ， 还 在 
wrapper.h 中 包含 了 常用 的 系统 头 文件 ， 这 样 大 多 数 程序 只 需要 一 条 include 语句 “#include 
"wrapperh"” 就 可 以 了 。 将 wrapperh 和 libwrappera 复制 到 工作 目录 下 ， 就 可 以 用 包装 函数 编写 程 
序 了 。 对 于 有 些 高 版 本 的 Linux 发 现 版 本 ,可 能 存在 libwrapper.a 库 格式 兼容 问题 ， 导 致 链接 过 程 找 
不 到 库 中 定义 的 函数 。 在 这 种 情况 下 ， 可 以 用 以 下 命令 重新 生成 库 文件 libwrapper.a: 

rm libwrapper.a 

gcc wrapperc ptwrapper.c 

ar IC libwrappera wrapper.o ptwrappero 
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使 用 包装 函数 非常 简单 。 以 前 面 的 testl.c 为 例 ， 只 需要 将 其 中 的 open 改 成 Open、 将 close 改 成 
Close， 将 头 文件 部 分 换 成 #include "wrapper.h" 就 可 以 了 。 修 改 后 的 程序 为 test3.c: 

#include "wrapper.h" 

voidmain0 


‘ 


intfd,fdl,i: 

char c: 

fd=Open("1.txt",O_ RDWR.0): 

for(i=0:i<10;i++) 

{ 
Read(fdl, &c, 1): 
Warite(], &c .1: 

四 


甸 于 现在 调用 的 包装 于 昭 定 义 在 当前 目录 下 的 库 文件 libwrapper.a 中 ，gcc 编译 命令 要 用 选项 
“ 工 .” 将 当前 目录 (“.”) 加 入 到 库 搜索 路 径 中 ， 还 需要 用 选项 -lwrapper 将 函数 库 libwrapper.a 链接 到 
可 执行 程序 : 

Sgce -0 test3 fest3.c -L. -wrapper 

现在 执行 程序 : 


Srm lt 

$ /est3 

Open error: No such file or directory 
Sp /etcpasswd lit 

$ /est3 

Tead error: Bad file descriptor 


可 以 看 到 , 程序 准确 地 报告 了 隐藏 的 错误 。 再 将 第 9 行 中 Read 函数 的 第 一 个 参数 纪 ] 修改 成 正 
确 的 刀 ， 另 存 为 test4.c， 重 新 编译 和 执行 程序 ， 结 果 正 确 : 

Sgcec -0 lest4.c -L. -iwrapper 

$ /est4 

TooOt:x:0:0 

本 书 的 实例 程序 或 配套 实验 都 可 使 用 错误 处 理 包装 函数 。 源 代码 包 中 的 libwrappera 是 在 Ubuntu 
8 环境 下 生成 的 ,有 些 版 本 的 gee 与 现成 的 libwrappera 不 兼容 , 就 需要 重新 生成 函数 库 , 方法 如 下 : 

$gcc -Cc wrapper.c pwrapper.c 


S$ rm libwrapper.a 
Sar rc libwrappera wrapper.o pwrapper.o 


思考 与 练习 题 3.11 假设 可 执行 文件 由 普通 用 户 执 行 ,C 程序 中 有 两 个 存在 运行 错误 的 代码 段 。 


I 代码 段 1: (2) 代码 段 2: 

int *p; int fd: char buff200]: 

P=NULL; fd=open("/etc/passwd".O_RDWR.0): 
#p=123; Tead(fd.buf.100): 


请 问 : 这 两 个 错误 是 什么 ? 程序 执行 过 程 中 会 发 生 什么 情况 ? 对 程序 员 来 说 ， 这 两 个 错误 有 何 
本 质 区 别 ? 


s3 目 


3.3.3 用 断言 检查 程序 状态 错误 


在 软件 的 开发 过 程 中 ， 通 过 条 件 编译 引入 printf 调用 来 调试 代码 是 一 种 常见 的 做 法 ， 但 一 般 不 
应 在 发 行 版 本 中 保留 这 些 信 息 。 然 而 经 常会 出 现 这 样 的 情况 : 程序 运行 中 出 现 的 问题 与 不 正确 的 假 
设 有 关 ， 并 非 代码 错误 。 这 些 不 正确 的 假设 往往 是 被 主观 认为 不 会 发 生 的 事件 。 例如 ， 人 们 在 编写 
函数 时 ， 会 认为 它 的 输入 参数 应 该 处 在 一 个 确定 的 范围 内 ， 但 万 一 传递 了 不 正确 的 数据 ， 就 可 能 造 
成 整个 系统 运行 不 正常 。 

系统 的 内 部 逻辑 需要 确认 没有 错误 。 针 对 这 种 情况 ，X/Open 提供 了 assert 宏 ， 它 的 作用 是 测试 
某 个 假设 是 否 成 立 ， 如 果 不 成 立 ， 就 停止 程序 的 运行 。 

#include <a.serth> 

void assert(int expression) 

assert 宏 对 表达 式 执行 求 值 ， 如 果 结果 为 flse， 就 往 标 准 错误 写 一 些 诊断 信息 ， 然 后 调用 abort 
函数 以 结束 程序 的 运行 。 

头 文件 asserth 中 定义 的 宏 受 NDEBUG 的 影响 。 如 果 程 序 在 处 理 这 个 头 文件 时 已 经 定义 了 
NDEBUG， 就 不 定义 assert 宏 。 这 意味 着 可 以 在 编译 命令 中 使 用 -DNDEBUG 关闭 断言 功能 ， 也 可 
以 把 下 面 这 条 语句 加 到 每 个 源 文件 中 来 禁止 断言 功能 , 但 这 条 语句 必须 放 在 #include<assert.h> 语 句 
之 前 。 

#define NDEBUG 

assert 宏 的 这 种 用 法 带 来 一 个 问题 。 如 果 在 测试 阶段 使 用 assert 宏 ， 但 在 发 行 版 本 中 将 其 关闭 ， 
那么 发 行 版 本 在 安全 检测 方面 就 比 测试 版 本 要 差 一 些 , 但 在 产品 代码 中 保留 assert 宏 又 是 不 可 取 的 ， 
因为 可 能 会 在 用 户 屏幕 上 显示 一 条 不 友好 的 assert failed 错误 提示 。 针对 这 个 问题 的 比较 好 的 解决 广 
法 是 ， 编 写 自己 的 错误 中 断 陷阱 例 程 ， 在 该 例 程 中 进行 断言 ， 但 不 需要 在 产品 代码 中 完全 禁用 该 功 
能 。 

下 面 的 程序 assertc 定义 了 一 个 函数 , 它 的 参数 必须 是 一 个 非 负数 ,， 它 用 断言 功能 来 保护 自己 不 
受 非法 参数 的 影响 。 该 程序 首先 包括 头 文件 asserth， 然 后 定义 一 个 平方 根 函 数 ， 该 函数 检查 自己 的 
参数 是 否 为 非 负数 ， 最 后 是 main 函数 ， 如 下 所 示 : 

#include <stdioh> 

#include <math h> 

#include <asserth> 

#include <stdlib.h> 

double my_sqrt(double x) 

{assert(x >= 0.0): 

Tetum sqrt (x ); 
i 
{ 
Printf("sqrt +2 =%%g\n" , my._sqrt(2.0)) : 
Printf ("sqrt -2 =%gm " . my._sqrt (-2.0)): 
exit (0): 
} 
现在 ， 运 行 这 个 程序 时 ， 如 果 提 前 给 my_sqrt 函数 传递 一 个 非法 值 ， 就 会 看 到 提示 发 生 断 言 冲 
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突 的 错误 。 错 误 信息 的 格式 将 随 系统 的 不 同 而 不 同 。 


Sgcc -0 assert assertc -lm 

S$ /assert 

sqrt +2= 1 .41421 

assert: assert .c: 7 : my_sqrt: Assertion x >= 0.0' failed. 
Aborted 


如 果 试 图 用 一 个 负数 来 调用 函数 my_sqrt，assert 宏 会 给 出 发 生 断 言 冲突 的 文件 名 和 行 号 ， 还 会 
给 出 失败 的 条 件 。 程 序 的 运行 被 一 个 abort 中 断 陷阱 终止 ， 这 就 是 用 assert 宏 调 用 abort 的 结果 。 

如 果 用 -DNDEBUG 选项 重新 编译 这 个 程序 ， 断 言 功能 将 被 排除 在 编译 结果 之 外 。 当 在 my _sqrt 
函数 中 调用 sqrt 函数 时 , 得 到 的 结果 是 NaNQNot a Number, 不 是 一 个 数字 ), 它 表明 一 个 无 效 的 结果 ， 
如 下 所 示 : 

Sgcc -0 assert assertc -DNDEBUG -Im 

$ /assert 


sqrt+2=1.41421 
sqrt -2=nan 


用 GDB/ddd 调试 器 诊断 运行 错误 


Linux 环境 提供 了 GDB(GNU project debugger) 调 试 器 ， 以 帮助 诊断 在 程序 运行 阶段 出 现 的 逻辑 
背 误 。 在 GDB 调试 器 中 ， 程 序 员 可 随时 启动 程序 、 设 置 断 点 、 暂 停 程序 的 执行 、 随 时 检查 变量 的 
值 是 否 正 确 、 逐 步 缩小 出 错 范围 、 最 后 锁定 出 错 行 并 排除 错误 。 

GDB 可 以 对 使 用 C、C++、Ada、Pascal 等 不 同 语言 编写 的 程序 进行 调试 ， 可 本 地 调试 也 可 远 
程 调试 ， 支 持 所 有 的 Linux 版 本 和 大 部 分 UNIX 平台 ， 甚 至 还 支持 Windows 平台 。 


*3.4.1 用 GDB 调试 程序 运行 错误 的 实例 
下 面 用 一 个 有 错 的 程序 gdbuse.c 来 演示 如 何 使 用 GDB 工具 来 调试 程序 ， 排 除 运行 错误 。 


#include <stdio.h> 
#include <string h> 
int main0 
{ char c=t: 
char s[100]: 
int tE 
int count=0; 
strepy(s."abcdefehijklmopqrstuvstuxyz0123456789"): 
for(i=0: i<strlen(s): iD 
if(sfiFe) 
Counttt: 
printft" 字 符 t 出 现 的 次 数 =96dn". count): 
} 


不 难看 出 ， 该 程序 统计 字符 串 s 中 字符 t 的 出 现 次 数 ， 编 译 并 执行 : 


Sgcc -0 gdbuse gdbuse.c 


S$ /gdbuse 
字符 t 出 现 的 次 数 =37 


正确 结果 应 该 是 1， 运 行 结果 是 错误 的 ， 现 用 GDB 进行 调试 。 
1. 第 一 步 : 启动 GDB 调试 器 ， 加 载 程序 


要 用 GDB 来 调试 程序 ， 需 要 在 编译 程序 时 添加 -g 选项 ， 指 示 gce 将 符号 表 写 入 生成 的 可 执行 
文件 。 

Sgcec -8 -0 gdbusegdbuse.c 

然后 执行 gdb 命令 ， 启 动 GDB 调试 器 ， 进 入 GDB 命令 界面 ， 出 现 GDB 命令 提示 符 “(gdb)” 
时 ， 可 键入 file gdbuse 命令 ， 加 载 gdbuse 程序 ， 如 下 所 示 : 

can@ubuntu:~$ gab 

GNU gdb (GDB) 7.2-ubuntu 

Copyright (C) 2010 free Software Foundation, Inc. 

License GPLV3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html> 

This is free software: you are free to change and redistribute it. 

Thereis NO WARRANTY. to the extent permitted by law. Type "show copying" 

and "show warranty" for details. 

This GDB was configured as "i686-linux-gnu". 

For bug reporting instructions, please see: 

<http://www.gnu.org/software/gdb/bugs/>. 

(gdb) file gdbuse 

Teading symbols from/home/cosoos/book/chapter2/exam...done. 

可 以 看 到 , GDB 工具 将 gdbuse 的 符号 表 加 载 进 来 了 , 接 下 来 就 可 以 输入 gdb 命令 来 进行 gdbuse 
程序 的 启动 、 暂 停 、 内 部 状态 检查 、 单 步调 试 等 。 当 然 也 可 以 将 执行 gdb 启动 命令 和 加 载 可 执行 文 
件 gdbuse 两 个 操作 在 一 条 命令 中 完成 ， 即 在 终端 窗口 中 输入 命令 gdb gdbuse。 

接 下 来 ， 可 在 (gdb) 命 令 提 示 符 下 ， 键 入 各 种 调试 命令 ， 对 程序 进行 排 错 ， 键 入 help 可 查看 各 个 
调试 命令 的 帮助 信息 。 程序 调试 完毕 后 , 可 输入 quit 或 直接 按 Chul+D 组 合 键 , 退出 GDB 调试 环境 ， 
回 到 Linux 命令 输入 状态 。 


2. 第 二 步 : 输入 调试 命令 ， 定 位 出 错位 置 


根据 程序 逻辑 ， 在 被 调试 程序 的 一 个 或 多 个 位 置 设置 断 点 ， 启 动 程序 ， 程 序 将 在 断 点 处 暂停 ， 
然后 就 可 检查 相关 变量 的 值 是 否 正 确 ， 判 断 错 误 是 否 已 经 发 生 。 若 变量 值 全 部 正确 ， 出 错位 置 可 能 
在 检查 点 之 后 ; 若 变量 值 有 错 ， 出 错位 置 可 能 在 检查 点 之 前 。 还 可 对 怀疑 的 代码 段 进行 单 步 执行 ， 
观察 变量 值 在 变化 过 程 中 是 否 出 错 ， 进 行 出 错位 置 的 精确 定位 。 

在 第 一 步 已 经 启动 GDDB、 加 载 好 程序 的 基础 上 ， 我 们 的 调试 思路 是 在 “count=0” 这 一 行 设置 
断 点 ， 然 后 单 步 执行 后 面 的 代码 , 每 次 程序 暂停 时 检查 变量 s、count、 i 和 站 条 件 , 看 是 否 存在 异常 。 
首先 用 “list” 命 令 显 示 源 程序 ， 找 到 “count=0” 这 一 行 的 行 号 是 7， 执 行 “break 7”， 在 第 7 行 设 
置 断 点 ， 然 后 执行 “run” 命 令 ， 在 GDB 环境 中 启动 程序 ， 程 序 运 行 到 第 7 行 就 自动 暂停 ， 并 显示 
该 行 源 代码 ， 如 下 所 示 。 


(gdb) list 
waming: Source file is more recent than executable. 


和 se 
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4 char c=*t: 

5 char s[100]: 

6 int 于 

7 int count=0; 

8 strepy(s,"abcdefehijkhmopqrstuvstuxyz0123456789"): 
9 for(i=0; i<strlen(s); i++) 

10 ifl(s[iF oO) 

11 counttt+; 


(gdb) break 7 

Breakpoint 1 at 0x8048495: file gdbuse.c, line 7. 
(gdb) run 

Starting program: /home/can/gdbuse 


Breakpoint 1, main ( at gdbuse.c:8 

gh int count=0; 

(gdb) 

接 下 来 用 单 步 执 行 方法 进行 错误 的 定位 ,输入 step 命令 ,执行 第 7 行 “count=0”, 输 入 print count， 
打印 的 count 值 为 0， 表 示 正 常 : 


(gdb) step 

8 strepy(s,"abcdefehijklmopqrstuvstuxyz0123456789"); 
(gdb) print count 

$2=0 


输入 step 命令 ， 执 行程 序 中 的 第 8 行 strepy(s,"abcdefeghijklmopqrstuvstuxyz0123456789")。 输 入 
print s， 显 示 一 行 异常 信息 “0x001a4fl0 in memcpy0 from /lib/libe.so.6”， 表示 该 函数 调用 不 太 规 范 ， 
可 能 是 常数 字符 串 不 可 以 作为 strcpy 函数 的 第 2 个 参数 ， 没 有 显示 下 一 行程 序 ， 可 能 第 8 行 并 未 
执行 : 

(edb) step 

Ox001a4f10 in memcpy 0 from /lib/libe.so.6 


(gdb) prints 
No symbol "s" in current context. 


再 次 输入 step， 执 行 后 输入 print s， 显 示 字符 串 s 的 内 容 正确 ， 并 显示 第 9 行 源 代码 : 


(gdb) step 

Single stepping until exit from fimction memcpy， 

which has no line number information. 

main 0O at exam.c:9 

9 for(i=0; i<strlen(s): i++) 

(gdb) Prints 

$3 = "abcdefehijkimopqrstuvstuxyz0123456789\000(000y~ 雪 000W205347025\000H363377277345Z\024\000\000\000\000\ 
000364237\004\bX\363377277H\203\004\b"353\021\000B364237004\bW210363377277Y\205\004\b$W203Q000364\177(\ 
000@\205\004\b" 

(gdb) 


继续 输入 step 多 次 ， 当 完成 for 循环 体 的 第 一 次 执行 且 再 次 显示 第 9 行 源 代码 时 ， 打 印 变 量 i、 
c、s[]、count 的 值 : 


(gdb) step 

0x001a3700 in strlen 0 from /lib/libc.so.6 
(edb) step 

Single stepping until exit from function strlen. 
‘which has no line number information. 

main () at gdbuse.c:10 

10 ifs[ 0) 


11 Count+t; 
(gdb) step 

for(i=0; i<strlen(s); i++) 
(gdb) print i 

$4=0 

(gdb) print s[i] 
$5=97% 

(gdb) print c 

$6=97* 

(gdb) print count 
$7=1 


不 难 发 现 ，s[0] 应 该 是 a， 已 经 被 更 改 成 W，count 应 该 还 是 0， 但 却 已 经 变 成 1， 初 步 判断 是 站 
语句 的 条 件 表达 式 计算 出 错 ， 导 致 count 错误 加 1。 检 查 源 程序 第 9 行 的 站 条 件 ， 发 现 本 来 应 该 是 
-个 比较 运算 表达 式 “s[ij==c”， 却 被 误 写成 赋值 语句 “s[]=c”， 进 而 找到 出 错 原因 。 排 除 错误 ， 
再 次 编译 执行 ， 得 到 正确 结果 2。 当 然 调试 过 程 中 发 现 strcpy 函数 调用 不 规范 ， 也 应 该 进行 纠正 。 

2 * 思 考 与 练习 题 3.12 用 GDB 调试 工具 对 以 下 程序 gdbex.c 进行 排 错 。 


#include <stdio.h> 
#include <stdlib.h> 
char buff (256); 
char* string: 
int main 0 
{ Printf ("Please input a string: "); 
gets (string); 
Printf ("nYour string is:%s\n" , string): 
} 


*3.4.2 ”常用 GDB 命令 
前 面 示例 用 到 的 GDB 命令 比较 简单 ， 但 多 数 情 况 下 已 经 够 用 。GDB 还 有 很 多 命令 ， 它 们 对 我 
们 调试 更 加 复杂 的 程序 有 用 ， 我 们 将 常用 的 几 个 命令 的 功能 、 用 法 等 列 入 表 3-10， 供 读者 需要 时 


表 3-10 常用 GDB 命令 
命名 描述 使 用 范例 
显示 程序 的 源 代码 list: 接着 上 次 list 命令 显示 结果 处 往 下 显示 程 
序 的 源 代码 
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伟 者 
命令 使 用 范例 
break 设置 断 点 break 7: 表示 在 打开 的 源 代码 的 第 7 行 设置 断 点 
run 运行 程序 Tun pl p2: 以 命令 行 参数 pl、p2 运行 程序 
print 显示 变量 或 表达 式 的 值 prints: 显示 变量 s 的 值 ，s 可 以 是 任何 类 型 ， 
甚至 可 以 是 字符 趾 、 数 组 、 结 构 休 变 量 

i 跟踪 某 个 变量 ， 每 次 程序 停 下 来 都 显示 该 变 | disp s: 跟踪 变量 s 的 值 ，s 可 以 是 任何 类 型 ， 

量 的 值 甚至 可 以 是 字符 串 、 数 组 、 结 构 体 变量 
i 程序 继续 执行 ， 直 到 下 一 个 断 点 continne: 该 命令 无 参数 
a 执行 下 一 条 语句 ， 若 该 语句 为 函数 调用 ， 则 | step 

进入 其 中 第 一 条 语句 后 停 下 来 
next 执行 下 一 条 语句 ， 若 该 语句 为 函数 调用 ， 则 | next 

执行 完 该 函数 调用 ， 在 当前 函数 的 下 一 条 语 

句 处 停 下 来 
start 开始 执行 程序 , 在 main 函数 的 第 一 条 语句 处 | start pl p2: 若 程序 的 执行 需要 带 命令 行 参数 ， 
backstrace | bt 。 ”| 查看 函数 调用 信息 。 ”| bt 查看 目前 的 函数 炭 套 调用 层 数 及 相关 信息 
fiame fiame 1: 显示 媒 套 调用 某 层 函数 的 调用 信息 
watch | 监视 变量 值 的 变化 ， 一 旦 被 监视 变量 的 值 发 | w 

生变 量 ， 程 序 就 暂停 下 来 
delete | dal | 上 | el2: 删除 第 2 个 断 点 


GDB 命令 中 有 的 拼写 较 长 ， 为 提高 输入 效率 ，GDB 允许 只 输入 命令 的 唯一 前 级 作为 命令 的 缩 
写 形式 。 


*3.4.3 用 ddd/GDB 调试 程序 


用 GDB 命令 调试 程序 不 太 方便 ， 效 率 也 很 低 ， 习 惯 使 用 VC++ 的 同学 可 能 不 喜欢 GDB 的 命令 
行 风格 。 为 满足 这 类 用 户 的 需求 ， 人 们 为 GDB 开发 了 图 形 界面 环境 ddd(Data Display DebuggeD， 功 
能 强大 ， 使 Linux 环境 的 程序 调试 也 变 得 容易 和 方便 。 下 面 用 一 个 示例 演示 使 用 方法 。 

以 调试 实例 程序 gdbuse.c 为 例 ， 用 “ddd gdbuse” 命 令 启 动 ddd。 该 命令 首先 启动 GDB， 再 
启动 其 图 形 界面 ddd， 还 完成 对 gdbuse 程序 符号 的 加 载 。ddd 调试 工具 的 右 侧 为 调试 工具 栏 ， 其 
中 : Run 运行 程序 ， 其 后 可 接 命令 行 参数 ，Step 单 步 执行 光标 所 在 语句 ，Next 运行 完 光标 所 在 语 
人 句 ; Cont 继续 执行 到 下 一 个 断 点 ; Until 执行 到 光标 所 在 语句 ，Edit 在 调试 中 调用 编辑 工具 直接 编 
辑 源 代码 。Data 菜单 中 的 常用 命令 Display、Print 用 于 在 程序 暂停 时 ， 显 示 变 量 或 表达 式 的 值 。 
给 gdbuse 设置 了 断 点 后 ， 启 动 程 序 ， 进 行 多 次 单 步调 试 ， 用 Display 命令 显示 局 部 变量 的 界面 如 
图 3-6 所 示 。 


DDD: /home/can/exam.c 


File Edit View Program Commands Status Source Daa 


0 info aras1 2 
Locals 
s = Ox8048550 "abcdefghijkimopqrstuvstuxyz0123456789"| 
oe Run 
count = 0 
三 nterupt 
Step | Stepi 
int count=0; RT 
for(i=0; i<strlen(s); i++) Untll | Finish| 
if(s[i]== c) Cont Kil 
COUNt++; 
printf("a-6cniaaneca cagania =%d\n", count); Up |Down 
和 fun1O; Undo| Bedo 
Edit | Make 
int funl() 
(gdb) step 
1: count = 0 
(gdb) step 
count = 0 
(gdb) 
A Display -3 “info locals™ (enabled) {a 


3-6 ddd 调试 界面 


命令 行 参数 和 环境 变量 的 读 取 方法 


将 数据 传递 给 Linux C 程序 有 四 种 方法 : 通过 scanf、getchar 等 数据 输入 函数 输入 数据 ; @ 用 
read、fiead 等 函数 从 磁盘 文件 中 读 入 数据 ; @@ 通 过 环境 变量 输入 数据 ; @ 通 过 命令 行 参数 输入 数据 。 
前 两 种 方法 在 C 语言 程序 设计 课程 中 介绍 过 ， 这 里 主要 讲述 环境 变量 与 命令 行 参 数 的 使 用 方法 。 


3.5.1 环境 变量 及 其 使 用 方法 


环境 变量 是 在 程序 运行 前 ， 在 命令 终端 创建 的 Shell 变量 都 是 字符 串 类 型 ， 不 需要 声明 类 型 ， 
直接 赋值 创建 ， 由 后 面 的 命令 或 C 语言 程序 读 取 ， 提 供 了 将 运行 环境 信息 或 输入 信息 传递 给 进程 的 
一 种 手段 .环境 变量 有 系统 预定 义 的 与 用 户 自 定义 的 两 种 ,预定 义 的 环境 变量 有 当前 工作 目录 PWD、 
系统 命令 搜索 路 径 PATH 等 ， 变 量 名 通常 为 大 写字 母 构 成 的 字符 串 。 自 定义 的 环境 变量 是 由 用 户 自 
己 创建 的 环境 变量 。 

创建 环境 变量 的 命令 格式 是 export 环 壕 苇 鳃 名 = 环境 读 饼 久 ， 如 export PHONE=0769- 
22861112。 在 命令 中 引用 环境 变量 的 方法 是 在 变量 名 前 加 美元 符号 5， 如 echo SPHONE。 如 果 环 境 
变量 名 与 其 他 非 空 字符 紧 贴 在 一 起 ， 那 么 在 引用 环境 变量 时 应 用 花 括号 将 环境 变量 名 括 起 来 ， 如 
echo ${PHONE}-1234. 

Linux C 程序 可 用 函数 char *getenv(char* env) 获 取 环境 变量 的 值 , 返回 指向 环境 变量 env 的 值 的 
指针 ， 用 函数 int setenv(const char *name,const char *value,int overwrite) 设 置 环境 变量 。 下 面 的 程序 


envtest.c 演示 了 环境 变量 的 读 取 方 法 。 
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char *sl,*s2,*s3; 

sl=getenv("PWD"): // 读 取 系统 环境 变量 PWD 
s2=getenv("PATH"); // 读 取 系 统 环境 变量 PATH 
s3=getenv("PHONE"): // 读 取 自 定义 环境 变量 PHONE 
printf(" 当 前 工作 目录 为 : %s \n",s1); 
printf(" 当 前 命令 搜索 路 径 为 : %s \n",s2); 
printf" 单 位 电话 为 : %s \n",s3); 


} 


Sgce emtestc -0 enmviest 

$expor1 PHONE=0769-22861112 。 # 创 建 自 定义 环境 变量 

S$ /enviest 

当前 工作 目录 为 : /home/can/exp 

当前 命令 搜索 路 径 为 : /usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games 
单位 电话 为 : 0769-22861112 


3.5.2 命令 行 参数 的 使 用 方法 

写 在 命令 行 中 的 参数 也 可 以 被 C 程序 读 取 ， 只 要 把 main0 函 数 的 原型 更 改 成 nt main(int argc， 
char *argv[]) 即 可 。argc 为 命令 行 参数 的 个 数 ,argv[] 为 执行 各 参数 字符 串 的 指针 。 下 面 的 程序 cmdpar.c 
演示 了 读 取 命 令 行 参数 的 方法 : 


#include <stdio.h> 

#include <stdlib.h> 

int main(int argc, char *argv[]) 
{ 


inti; 
Printf(" 以 空格 分 隔 的 参数 个 数 ( 包 括 程序 名 本 身 ): %d \n".argc): 
for (i=0; i<argc: i++) 

printft" 命 令 行 参数 argv[9%edj= %s "iargv[i]): 


现在 编译 和 运行 程序 : 

Sgce cmdparc -0 cmdpar 

$Vemdparparaml 和 参 塌 3 "complex param" 

以 空格 分 隔 的 参数 个 数 (包括 程序 名 本 身 ): 4 

命令 行 参数 argv[0]= /cmdpar 

命令 行 参数 argv[1]= paraml 

命令 行 参数 argv[2] 参数 2 

命令 行 参 数 argv[3 上 上 complex param 
gb 思考 与 练习 题 3.13 ”如 果 一 个 C 程序 的 入 口 表 示 为 main(int argc, char *argv[ ] )， 该 程序 编 
译 后 的 可 执行 程序 为 a.out; 那么 在 命令 行 输入 “Jaout -ffoo” 后 ，main 函数 中 的 参数 argv[1] 
指向 的 字符 串 是 
好 = 思考 与 练习 题 3.14 如 果 用 户 输入 一 个 参数 ， 则 打印 “no args”; 如 果 输 入 两 个 参数 ， 并 且 
第 二 个 命令 行 参数 是 -a， 则 打印 拭 will deal with -a”; 如 果 再 输入 -]， 则 打印 “will deal with -1”。 


make 工具 


在 编写 大 型 程序 时 ,会 有 很 多 源 程序 ,这些 源 程序 如 果 都 由 人 工 维护 ,将 会 十 分 烦琐 。make 工 
有 具 可 以 帮助 我 们 管理 和 维护 所 开发 项 目的 源 代码 ， 使 这 些 例 行 工作 自动 化 。make 是 Linux 提供 的 
一 个 工具 ， 可 以 控制 从 程序 源 文件 中 生成 的 可 执行 代码 的 过 程 。make 工具 根据 makefile 文件 的 内 
容 构建 程序 ，makefile 文件 列 出 了 每 一 个 非 源 程序 文件 以 及 如 何 从 其 他 文件 构造 这 些 文件 的 命令 。 
当 编写 程序 时 ， 应 当 为 其 编写 一 个 makefile 文件 ， 利 用 make 工具 构建 及 安装 程序 ， 以 为 程序 的 安 
装 及 维护 提供 便利 。 现 在 ，make 已 经 成 为 软件 项 目 中 不 可 或 缺 的 工具 ， 在 编写 Java 程序 时 使 用 的 
ant 工具 与 make 工具 的 作用 相似 。 


*3.6.1 引入 make 工具 的 原因 
考虑 由 四 个 文件 prol.c、pro2.c、libh、prog.c 组 成 的 一 个 项 目 : 


bh. Dro2c 

void prol(int); #include <stdioh> 

Void pro2(char *); Void pro2(char *arg) 

{ 

Drolec Printf(" 您 好 :9%sn", arg) : 

#include <stdio.h> } 

void prol(int arg) Drogc_ 

{ #include "lib.h" 

printft" hello: %d\n",arg) : intmain0 

} { 
prol(12345): 
pro2("Linux world"); 
exit(0): 


} 
开发 项 目的 一 般 方法 是 : 首先 创建 一 个 单独 的 目录 ， 在 其 中 用 gedit 录入 这 四 个 程序 源 文件 : 


Smkdir dirl 

Sed dirl 

S$ geditprol.c pro2.c lib.h prog.c 

然后 编译 执行 这 些 程序 。 编 译 方法 有 两 种 ， 第 一 种 方法 是 用 多 条 gcc 命令 单独 编译 每 个 程序 ， 
最 后 链接 起 来 并 执行 : 

Sgce -ce prolc -0 prol.o 

Sgcec -c pro2c -0 pro2.0 

Sgcec -c progc -0 prog.o 

Sgcec prolo pro20 prog.o -0 prog 

Sprog 


第 二 种 方法 是 用 一 条 命令 同时 完成 四 个 程序 源 文件 的 编译 以 及 整个 程序 的 链接 ， 然 后 执行 : 


Sgcc prolc pro2.c prog.c -0 prog 
S$ prog 
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虽然 可 通过 一 条 编译 命令 “gcc -o prog progc prol.c pro2.c” 将 上 述 项 目 编译 成 可 执行 
程序 ， 但 对 于 由 数 十 、 数 百 、 数 千 个 程序 源 文件 构成 的 软件 系统 项 目 ， 若 每 次 对 某 个 程序 源 文 件 做 
细微 修改 后 ， 都 要 将 所 有 程序 源 文件 重新 编译 一 次 ， 命 令 输入 将 非常 烦琐 ， 编 译 过 程 也 非常 耗 时 ; 
Linux 的 make 工具 可 以 管理 多 个 文件 模块 ， 它 提供 一 种 灵活 机 制 来 实施 大 型 软件 项 目 管理 ， 高 效 地 
管理 程序 的 编译 过 程 。make 机 制 依赖 于 make 命令 和 makefile 文件 来 对 项 目的 编译 过 程 进行 管理 ， 
makefile 文件 描述 程序 源 文件 之 间 的 相互 依赖 关系 ，make 命令 根据 makefile 文件 给 出 的 规则 ， 执 行 
编译 操作 管理 。 系 统 中 的 部 分 文件 改变 时 ，make 工具 根据 这 些 关 系 仅 执行 必要 的 编译 操作 。 如 果 软 
件 包 括 几 十 个 程序 源 文 件 和 多 个 可 执行 文件 ，make 工具 将 特别 有 用 。 

makefile 主要 由 一 系列 规则 构成 , 每 条 规则 由 “make 目标 ”和 目标 后 的 命令 序列 构成 。makefile 
规则 有 显 式 规则 与 隐 含 规则 两 种 ，makefile 文件 还 包括 变量 定义 、 注 释 等 。 


*3.6.2 用 makefile 描述 源 文件 间 的 依赖 关系 


考虑 前 面 由 programc、prol.c、pro2.c、lib.h 四 个 源 文件 构成 的 项 目 ， 各 源 文件 间 的 依赖 关系 可 
用 图 3-7 所 示 的 有 向 无 环 图 (这 里 是 更 简单 的 树 型 结构 ) 表 示 。 


prol.c pro2.c prog.c lib.h 
编译 过 程 : gcc -<c … 中 | NA 
prol.o pro2.0 prog.o 


链接 过 程 ，gcc … ww | We 


prog 
图 3-7 C 语言 项 目 源 文件 间 的 依赖 关系 


从 上 述 依赖 关系 图 可 知 ， 如 果 只 有 prol.c 修改 过 ， 只 需要 重新 编译 prol.c， 更 新 prol.o， 再 将 
所 有 .o 文件 链接 成 可 执行 程序 program 即 可 ，pro2.c 与 program.c 都 不 需要 重新 编译 ， 因 此 编译 效率 
很 高 ， 尤 其 当 一 个 项 目 包括 成 百 上 千 个 文件 时 ; 如果 只 有 pro2.c、program.c 或 libh 修改 过 ， 也 只 需 
要 更 新 相应 的 .o 文件 。 实 际 上 ， 修 改 图 3-7 中 的 一 个 文件 后 ， 只 需要 重新 生成 从 该 文件 到 最 终 目 标 
(prog) 路 径 的 各 个 文件 对 象 。 

可 用 类 似 于 邻接 表 的 方法 来 表示 项 目的 依赖 关系 : 每 个 目标 文件 节点 与 其 依赖 关系 节点 间 的 关 
系 用 一 条 规则 表示 ， 由 依赖 关系 行 和 命令 行 构成 ， 依 赖 关系 行 的 格式 为 “目标 文件 列表 :依赖 文件 列 
表 ”， 其 下 是 从 依赖 文件 列表 生成 目标 文件 的 命令 序列 。 由 于 所 有 规则 保存 在 makefile 文件 中 ， 为 
区 分 依赖 关系 行 与 命令 行 , 规定 依赖 关系 行 从 第 一 列 开始 写 , 命令 行 的 第 一 个 字符 必须 是 <TAB> 键 。 
这 样 每 条 规则 结构 如 下 : 

目标 文件 列表 : 依 天 文件 列表 


<TAB> 命 令 1 
<TAB> 命 令 2 


描述 这 个 四 文件 项 目 依赖 关系 的 规则 的 makefile 文件 如 下 : 


prog: prol.o pro2.0 prog.o 

gee -0 prog prol.o pro2.0 prog.0 
prol.o: prol.c 

gcc -< prolc -0 prol.o 


Pro2.0: pro2.c 
gcc -< pro2.c -0 pro2.0 
Prog.o: prog.c lib.h 
gcc < progc -0 progo 

用 gedit 创建 该 makefile 文件 并 放 到 当前 目录 下 ， 键 入 命令 make target 以 更 新 目标 target， 它 指 
示 make 工具 根据 makefile 文件 中 的 描述 , 对 所 有 最 近 修 改过 的 源 程序 文件 到 target 路 径 的 所 有 规则 
依次 执行 一 次 ， 重 新 生成 目标 ， 从 而 保证 从 源 文件 的 树叶 节点 到 树 根 节点 的 target 路 径 上 的 所 有 规 
则 中 ， 目 标 文件 的 产生 时 间 都 比 相应 依赖 文件 的 产生 时 间 更 新 。 省 略 target 的 make 命令 ， 其 target 
为 第 一 条 规则 的 目标 。 本 例 中 make 等 价 于 make prog， 由 于 此 时 prol.o、pro2.o、prog.o 都 不 存在 ， 
它 驱 动 make 工具 执行 这 些 目 标 文件 的 规则 ， 产 生 这 些 目 标 文件 ， 再 执行 prog 规则 ， 生 成 可 执行 文 
件 prog， 然 后 执行 该 文件 : 

S$ make 

gcc © prolc -0 prolo 

gcc © pro2c -0 pro2.0 

gcc < progc -0 progo 

gcc -0 prog prol.o pro2.0 prog.o 

$ /prog 

这 种 处 理 顺序 保证 了 与 prog 目标 直接 相关 的 规则 (prog 规则 ) 或 间接 相关 的 规则 (prol.o 规则 、 
pro2.o 规则 、prog.o 规则 ), 在 依赖 关系 中 目标 文件 的 时 间 都 比 依赖 文件 的 更 新 。 接 下 来 , 仅 对 prog.c 
进行 微小 修改 (或 用 touch 命令 更 新 prog.c 的 时 间 )， 再 次 执行 make 以 更 新 prog， 由 于 此 时 progl.o 
规则 、pro2.o 规则 的 目标 文件 都 是 更 新 的 ， 这 两 条 规则 无 须 执行 ，make 工具 只 需要 处 理 prog.o 规则 
和 prog 规则 。make 命令 的 执行 结果 如 下 : 

S fouch prog.c 

Smake 

gcc -< progc -0 progo 

gcc -0 prog prol.0 pro2.0 prog.o 

第 一 次 执行 make 或 在 执行 make clean 后 执行 make， 都 会 使 依赖 链 上 的 所 有 规则 依次 执行 ， 以 
生成 目标 文件 。 
弛 “思考 与 练习 题 3.15 

(1) 车 删除 所 有 目标 文件 和 可 执行 文件 ， 命 令 make prog.o 会 导致 哪些 命令 被 执行 ? 

(2) 对 于 图 3-7 中 的 makefile 文件 ， 若 已 经 产生 了 prog 可 执行 文件 ， 但 对 prol.c 进行 了 细微 修 
改 ， 写 出 输入 make prog 会 导致 命令 按 何 种 顺序 执行 。 


*3.6.3 引入 伪 目 标 以 增强 makefile 功能 
在 大 型 软件 开发 项 目 管理 中 ， 有 时 需要 清除 所 有 可 执行 文件 和 目标 文件 ， 以 便 对 全 部 源 程序 重 
做 一 次 完整 编译 。 这 时 可 通过 增加 一 条 clean 规则 来 实现 ， 比 如 上 面 实例 中 的 clean 规则 可 写成 : 


clean: 
rm A *.0 prog 


由 于 clean 目标 并 不 存在 ， 每 次 执行 make clean 命令 时 ，make 工具 都 会 执行 clean 规则 ， 执 行 


二 
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rm 命令 ， 清 除 中 间 目 标 文件 和 可 执行 文件 。 但 是 ， 如 果 当 前 工作 目录 中 碰巧 存在 文件 clean， 情 况 
就 不 一 样 了 。 同 样 输入 make clean， 由 于 这 条 规则 没有 任何 依赖 文件 ，make 认为 目标 clean 已 经 更 
新 ， 而 不 去 执行 规则 中 定义 的 命令 ， 因 此 命令 mm 将 不 会 执行 。make 工具 通过 引入 伪 目 标 .PHONY 
来 解决 该 问题 。 基 本 方法 是 将 clean 规则 改 为 如 下 形式 : 
PHONY: clean 
clean: 
m *#.0 prog 


这 样 ， 上 述 项 目的 makefile 文件 将 被 改 为 如 下 所 示 : 


gcc -< prolc -0 prol.o 
ge -< pro2.c -0 pro2.0 
gee < progc -0 prog.0 
gcc -0 prog prol.o pro2.0 prog.0 
.PHONY: clean 
clean: 
m *#.0 prog 


下 面 测试 clean 规则 的 正确 性 : 


*3.6.4 用 变量 优化 makefile 文件 


makefile 文件 中 很 多 目标 文件 、 源 程序 文件 的 名 字 ， 以 及 编译 程序 gec 的 名 字 在 多 个 地 方 重复 
出 现 ， 若 一 处 写 错 ， 都 将 导致 出 错 ， 同 时 给 文件 更 名 带 来 不 便 ， 采 用 makefile 变量 可 解决 这 个 问题 。 
makefile 中 的 变量 定义 语法 为 : VARNAME=string。 用 户 自 定义 变量 名 一 般 大 写 ， 变 量 值 都 是 字符 
串 ， 不 需要 指定 类 型 ， 变 量 定义 行 顶 格 写 ， 中 间 无 分 隔 符 “: ”， 以 便 与 规则 的 依赖 关系 行 区 分 。 
引用 VARNAME 变量 值 的 方法 是 $f{VARNAME}，make 解释 规则 时 ，VARNAME 在 等 式 右 端 展开 
为 定义 它 的 字符 串 。 

前 面 的 makefile 文件 可 用 变量 方法 重 写 为 如 下 形式 : 


OBJS=prol.o pro2.0 prog.o 
CC=gcc 
Prog: ${OBJS} 

${CC} -0 prog S${OBJS} 
prol.o: prol.c 

S${CC} -< prolc -0 prolo 
pro2.0: pro2.c 

S${CC} -< pro2c -0 pro2.0 
prog.0: prog.c libh 
${CC} <¢ progc -0 progo 
.PHONY: clean 
clean: 

Im *0o prog 


在 该 makefile 文件 中 , 将 目标 文件 名 组 成 的 字符 串 赋 给 变量 OBJS, 将 编译 工具 名 称 gcc 赋 给 变 
量 CC。 这 样 带 来 的 第 一 个 好 处 是 ， 第 一 条 规则 中 ， 依 赖 关 系 行 的 右边 部 分 与 命令 行 部 分 的 目标 文 
件 列表 都 改 为 较 短 的 变量 引用 $(OBJS)， 这 样 不 容易 写 错 。 

第 二 个 好 处 是 ， 可 方便 更 换 不 同 的 编译 工具 进行 项 目 编译 。 比 如 ， 如 果 希 望 用 amm-linux-gcc 编 
译 程序 ， 以 生成 可 在 基于 ARM 处 理 器 的 嵌入 式 系统 设备 上 运行 的 可 执行 程序 prog， 只 需要 将 变量 
定义 行 “CC=gce” 改 为 “CC=arm-linux-gcc”。 甚 至 还 可 以 不 修改 makefile 文件 ， 在 make 命令 行 中 
重 定义 变量 CC 即 可 ， 即 像 下 面 这 样 写 make 命令 : 


Smake CC=arm-linux-gcc 
am-linux-gcc -c prolc -0 prol.o 


这 样 ，make 工具 就 会 优先 用 make 命令 中 的 变量 赋值 来 处 理 makefile 文件 ， 生 成 用 编译 工具 
arm-linux-gcc 产生 的 可 执行 程序 。 
和 * 思 考 与 练习 题 3.16 

假设 当前 目录 下 有 文件 al.c、a2.c、a3.c， 其 中 al.c 中 带 有 main 函数 ， 其 他 文件 中 为 用 户 
自 定义 函数 ， 供 main 函数 调用 。 创 建 符合 要 求 的 源 代码 文件 ， 编 写 makefile 文件 以 完成 对 这 几 
个 文件 的 编译 工作 ， 生 成 可 执行 文件 a。 


3.6.5 用 预定 义 变量 和 隐 含 规则 简化 makefile 文件 


make 工具 还 定义 了 很 多 预定 义 变量 来 表示 一 条 规则 的 依赖 关系 行 中 已 经 出 现 过 的 名 称 , 在 规则 
的 命令 行 部 分 只 需要 引用 这 些 预 定义 变量 , 目标 文件 名 称 仅 出 现 一 次 , 可 避免 拼写 错误 。 在 makefile 
文件 中 可 使 用 的 预定 义 变量 如 表 3-11 所 示 。 


表 3-11 预定 义 变量 


变量 含义 
表示 规则 中 目标 文件 的 名 称 
依赖 列表 中 的 第 一 个 文件 名 
比 目 标 文件 更 新 的 以 空格 分 隔 的 依赖 文件 
以 空格 分 隔 的 所 有 依赖 文件 ， 重 复 的 依赖 文件 会 被 合并 
在 显 式 规则 下 ， 表 示 文 件 名 称 的 主要 部 分 ( 即 不 包括 文件 的 扩展 名 ) 


利用 自动 变量 将 上 述 实例 中 的 makefile 文件 简化 为 如 下 形式 : 


OBJS=prol.o pro2.0 prog.o 
CC=gcc 
prog: ${OBJS} 

${CC} -0 S$S@ $$ 
prol.o: prol.c 

${CC} < $< -0 $@ 
Pro2.0: pro2.c 

$S{CC} < $< -0 3@ 
prog.o:progc libh 

$S{CC} < $< -0 3@ 
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.PHONY: clean 
clean: 
m *#.0 prog 
下 面 进 行 测试 : 
Smake clean 
Smake 
Sprog 
使 用 make 生成 目标 文件 xxx.o 时 ， 它 知道 程序 源 文件 一 般 为 xxx.c、xxx.C 或 xxx.S。 所 以 , 它 
知道 首先 查找 以 c、.C 或 s 为 后 级 的 文件 ， 然 后 调用 gcc -c xxx.c -o xxx.o 以 生成 目标 文件 xxx.o。 它 
还 知道 目标 文件 名 通常 和 源 文件 名 是 相同 的 ， 只 是 后 组 不 一 样 ， 这 种 功能 称 为 标准 依赖 性 。 所 以 ， 
prog.0 : prog.c lib.h 这 样 的 语句 可 以 简写 成 prog.o: libh, 同时 还 可 把 生成 prog.o 的 命令 从 规则 中 删除 。 
prol.o: prol.c 的 规则 与 命令 可 以 简单 地 删 去 或 省 略 ， 称 为 隐 式 规则 ， 不 能 省 略 的 其 他 规则 称 为 显 式 
规则 。 make 将 自动 查找 与 它 相 关 的 隐 式 规则 , 产生 适当 的 命令 以 产生 目标 文件 。 因此 , 上 述 makefile 
文件 的 内 容 可 以 根据 后 绷 规 则 简写 成 ; 
OBJS=prol.o ”pro2.0 prog.o 
CC=gee 
prog: ${OBJS} 
S$S{CC} -0 5S@ SS 
prog.o: libh 
.PHONY' clean 
clean: 
m *#.0 prog 


现在 用 以 下 命令 进行 测试 : 


本 章 小 结 


本 章 首先 介绍 和 演示 了 gee 开发 套件 和 gcc 命令 的 基本 使 用 方法 ， 将 应 用 程序 的 编译 过 程 分 解 
成 预 处 理 、 编 译 、 汇 编 、 链 接 四 个 阶段 ， 从 而 帮助 学 生理 解 可 执行 程序 的 产生 过 程 ， 以 及 在 每 个 阶 
段 对 用 户 程序 做 了 哪些 转换 。 

与 Visual C++ 等 图 形 化 集成 开发 环境 (IDE) 相 比 ， 用 gee 开发 应 用 程序 时 ， 错 误 的 诊断 和 排除 更 
加 困难 ， 但 这 是 CIC++ 程 序 员 或 计算 机 专业 毕业 生 必 备 的 能 力 。 我 们 通过 对 本 课程 实验 中 遇 到 的 主 
要 问题 进行 汇总 ， 给 出 常见 编译 错误 的 诊断 对 照 表 格 ， 引 入 检查 程序 状态 正确 性 的 断言 方法 ， 推 荐 
有 助 于 及 时 发 现 和 报告 系统 调用 函数 执行 失败 的 包装 方法 ， 描 述 采用 gdb 诊断 运行 错误 的 过 程 。 

本 章 重 点 介绍 了 Linux 系统 自 带 的 常用 函数 库 ， 如 字符 串 处 理 函 数 、 数 学 函数 、 数 据 结构 函数 ， 
并 给 出 了 若干 实例 , 为 我 们 编写 应 用 程序 提供 了 极 大 便利 。 还 介绍 了 用 于 大 型 软件 项 目 管理 的 make 
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工具 , 实际 上 Visual CH+、Eclipse、Android 开发 环境 都 借鉴 了 使 用 make 工具 管理 项 目 文件 的 方法 。 
了 解 make 工具 的 工作 原理 和 编写 方法 对 一 般 的 计算 机 专业 人 员 来 说 有 两 方面 的 意义 : 一 是 当 项 目 
组 开发 较 大 软件 项 目 时 ， 可 能 需要 自己 编写 makefile 文件 以 进行 项 目 管理 ， 二 是 学 习 、 使 用 、 移 植 
很 多 开源 软件 时 ， 有 时 要 求 看 懂 它 们 的 makefile 文件 。 


课 后 作业 


5 思考 与 练习 题 3.17 阅读 以 下 C 程序 ， 写 出 输出 结果 。 
#include <stdio.h> 
#include <stdlib.h> 
int main(int argc, char *argv[]) 
inti; 
Printf("arge=%d \n",argc): 
for(i=argc-1; >=1; i--) 
Printf("argv[%d]= %s \n",L.arev[i]); 
printft “PHONE =%s” , getenv("PHONE")): 
} 
Sgce fest2c -0 test2 
Sexport PHONE=10086 
S$ /est? paraml praram?2 "complexparam" 


惠 ”* 思 考 与 练习 题 3.18 ”阐述 静态 链接 库 和 动态 链接 库 之 间 的 相同 点 和 不 同 点 。 
和 * 思 考 与 练习 题 3.19 假设 DynamicShareLibTest.c 调 用 了 StringCat.c、StringPrint.c 中 的 函数 。 
请 写 出 相应 的 指令 : 

(1) 把 文件 StringCat.c 和 StringPrint.c 编译 为 动态 共享 库 libDynamicShared.so， 放 在 当前 目 
录 下 。 

(2) 使 用 libDynamicShared.so 编译 DynamicShareLibTest.c。 
gb 思考 与 练习 题 3.20 ”编写 一 个 名 为 myecho 的 程序 ， 打 印 出 它 的 命令 行 参 数 和 环境 变量 。 
例如 : 


S$./myecho argl arg2 

Command line arguments: 

argv[0]: myecho 

argv[1]: argl 

argv[2]: arg2 

envp[0]: PWD=/usr/bin:/usr/sbin:... 
envp[1]: TERM=/emacs 


和 * 思 考 与 练习 题 3.21 阐述 make 命令 工具 如 何 确定 哪些 文件 需要 重新 生成 ， 而 哪些 不 需要 
8 * 思 考 与 练习 题 3.22 假设 有 一 个 项 目的 文件 依赖 关系 如 图 3-8 所 示 ， 现 在 要 生成 menu 主 
模块 ， 请 为 该 项 目 编写 相应 的 makefile 文件 ， 要 求 : 
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(1) 键入 命令 make 可 生成 可 执行 程序 menu， 并 复制 拷贝 到 /usr/bin 目录 下 ; 
(2) 键入 命令 “make < 模块 名 >” 可 对 各 个 目标 模块 独立 编译 ; 
(3) 键入 命令 make clean 可 删除 后 缓 为 .o 的 目标 文件 。 


musicc picture.c menu.c menu.h 


musico picture.o menu.o 


menu 


3-8 示例 项 目的 文件 依赖 关系 


ge * 思 考 与 练习 题 3.23 采用 隐 式 规则 重新 编写 上 述 makefile 文件 。 

可 = 思考 与 练习 题 3.24 ”程序 调试 有 n( 小 于 10 个 ) 个 互 不 相同 的 整数 ， 删 除 其 中 指定 的 整数 。 
要 求 定义 查找 函数 find(int *x, int n, int a)、 删除 函数 delete(int *x, intn, int nm) 和 输出 函数 print(int 
*x, int n)。 地 数 find 的 功能 是 查找 指定 整数 的 位 置 。 函 数 delete 的 功能 是 删除 指定 位 置 的 整数 。 
函数 print 的 功能 是 输出 删除 后 的 结果 。 错 误 的 源 程序 如 下 : 


#include <stdio.h> 
void main() 
{ 
inti, x, n, afn], *p: 
printf(" 输 入 数组 元 素 的 个 数 n (0<n<10): "); 
scanf("%d", &n): 
Printf(" 输 入 数组 %d 个 元 素 : ", n); 
for(p=a, i=0; i<n; i++)scanf("%d", &p++): 
Printf(" 输 入 待 删 除 的 整数 x: "); 
scanf("%d", &x): 
i=find(a,n,x);/* 调试 时 设置 断 点 */ 
if(i==n)printf(" 没 有 找到 需要 删除 的 整数 1"); 
else{ 
printf" 找 到 要 删除 的 整数 9%ed， 删 除 结果 为 : \n".x); 
n=del(a.n.i): /* 调试 时 设置 断 点 */ 
Print(a,n): 
} 
printf"\n"): 
上 
int find(int *x.int n,int a) /* 查找 函数 */ 
{ 
inti: 
for(i=0;i<n:it+) 
if(*x++!=a)break: 
retum i; /* 调试 时 设置 断 点 */ 
} 
int del(int *x, int n. int m) /* 删除 函数 */ 
inti; 
for(i=m:i<n:it+)x[i]=x[i+1]: 
Tetum n-1; /* 调试 时 设置 断 点 */ 
} 


void print(int *x, int n) /* 输出 函数 */ 
inti 
for(i=0:i<n:it+)printf("%5d",*x++): 
printf"\n"); 

lL 


改正 后 ， 程 序 的 运行 结果 为 : 


(D) (2) 

输入 数组 元 素 的 个 数 n (0<n<10): 6 输入 数组 元 素 的 个 数 n (0<n<10): 6 
输入 数组 %d 个 元 素 : 123456 输入 数组 %d 个 元 素 : 123456 
输入 待 删除 的 整数 x: 4 输入 待 删除 的 整数 x: 8 
找到 要 删除 的 整数 4， 删 除 结果 为 : 没有 找到 需要 删除 的 整数 ! 


T1002 

要 求 用 GDB 或 ddd 对 程序 进行 调试 排 错 , 给 出 正确 的 程序 清单 .运行 界面 与 运行 结果 截图 。 
思考 与 练习 题 3.25 调用 字符 串 处 理 库 函 数 ， 编 写 程序 parser.c， 从 一 个 Linux 命令 字符 串 
中 ， 提 取 各 个 命令 行 参数 ， 以 每 行 一 个 参数 的 形式 显示 出 来 ， 命 令 行 参数 之 间 可 用 一 个 或 多 个 
空格 分 隔 。 例 如 ， 若 输入 的 命令 字符 串 是 "ls -1 -a abc*"， 则 程序 输出 应 该 是 : 


细 = * 思 考 与 练习 题 3.26 ”调用 字符 串 处 理 库 函数 ,修改 上 一 题 中 的 parser.c， 支 持 命令 行 中 用 引 
号 给 出 且 其 中 包括 空格 的 参数 ， 如 echo "hello world"， 输 出 应 为 : 


echo 
hello world 


史 思考 与 练习 题 3.27 编程 实习 题 : 假设 有 一 个 字符 数组 char num[10][]= {"hello"，"world"， 
"we","dgut", "university","abe","china","Dongguan","Guangdong","Songshanhu","computer"}。 

(1) 写 一 个 程序 ， 调 用 Linux 系统 的 qsort 库 函 数 ， 对 数组 num 进行 排序 后 ， 按 顺序 输出 各 
字符 串 元 素 的 值 。 

(2) 写 一 个 程序 ， 调 用 Linux 二 又 树 操作 函数 ， 用 数组 num 按 字典 序 建立 二 又 树 ， 按 中 序 
遍历 顺序 输出 各 字符 串 元 素 的 值 ， 运 行程 序 以 验证 其 正确 性 。 
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第 4 章 


输入 输出 与 文件 系统 


文件 系统 是 操作 系统 中 负责 存储 和 管理 信息 的 模块 ， 它 以 一 致 的 方式 管理 用 户 和 系统 信息 的 存 
储 、 检 索 、 更 新 、 共 享 和 保护 ， 并 为 用 户 提供 一 整套 方便 有 效 的 文件 使 用 和 操作 方法 。 对 计算 机 类 
专业 学 生来 说 ， 学 习 文件 系统 的 基本 工作 原理 ， 掌 握 文件 和 IO 编程 ， 对 未 来 开发 出 效率 高 、 可 靠 
性 好 的 软件 能 带 来 帮助 , 同时 也 是 理解 计算 机 系统 工作 原理 , 未 来 从 事 相关 研究 与 应 用 优化 的 基础 。 
本 章 主要 讲授 文件 系统 层次 结构 、 系 统 JO、 内 核 文 件 IO 数据 结构 、 文 件 组 织 、 文 件 物理 结构 等 。 


本 章 学 习 目标 : 

e 了 解 文件 系统 层次 结构 和 文件 IO 库 之 间 的 关系 、 应 用 场合 、 性 能 比较 

。 掌握 使 用 系统 级 IO 函数 进行 文件 IJO、 文 件 元 数据 读 取 的 基本 编程 方法 ， 能 根据 应 用 场景 
进行 VO 库 的 选择 

。 掌握 内 核 文 件 IO 数据 结构 的 用 途 与 文件 打开 过 程 , 理解 文件 描述 符 的 含义 、 文 件 共享 的 原 
理 以 及 1/O 重 定向 的 原理 

e 掌握 文件 组 织 和 文件 物理 结构 ， 能 进行 优 务 对 比分 析 ， 理 解 提高 文件 搜索 效率 的 基本 方法 


EI 文件 系统 层次 结构 


4.1.1 文件 系统 层次 结构 简介 


一 般 来 说 ， 我 们 要 处 理 的 数据 信息 都 存在 于 文件 中 ， 处 理 结果 也 保存 于 文件 中 ， 而 文件 数据 保 
存在 外 存 中 。 磁盘 是 最 常见 的 外 存 , 它 属于 存储 设备 , 用户 不 能 像 操作 内 存 数 据 结构 一 样 读 写 磁盘 。 
磁盘 有 两 个 特点 : 一 是 磁盘 属于 外 部 设备 ， 外 设 编程 难度 极 大 ; 二 是 内 存 与 磁盘 之 间 只 能 以 数据 块 
而 非 字 节 为 单位 来 传递 数据 ， 数 据 块 大 小 通常 为 磁盘 块 大 小 ， 通 常 为 512B~4KB。 实 际 上 文件 读 写 
过 程 是 非常 复杂 的 。 

为 实现 对 磁盘 的 高 效 便捷 操作 ， 操 作 系 统 通过 文件 系统 模块 来 存储 、 定 位 、 提 取 数据 。 为 驾驭 
系统 复杂 性 ， 通 常 将 文件 系统 设计 成 多 层 结构 ， 如 图 4-1 所 示 。 每 层 都 利用 较 低 层 的 功能 创建 新 的 
功能 来 为 更 高 层 服务 。 


LO 控制 Q/O controD) 为 最 底层 ， 由 设备 驱动 程序 和 中 断 处 理 程序 组 成 ， 实 现 内 存 与 磁盘 之 间 的 
信息 传输 。 设 备 驱动 程序 作为 翻译 器 ， 将 上 层 给 出 的 命令 ， 翻 译 成 底层 硬件 能 执行 的 动作 或 指令 ， 
实现 数据 读 写 ， 如 "retrieve block 123" 表 示 上 层 需要 读 取 123 号 磁盘 块 的 内 容 。 

基本 文件 系统 (basic file system) 向 合适 的 设备 驱动 程序 发 送 对 磁盘 上 的 物理 块 进行 读 写 的 命令 。 
磁盘 块 的 地 址 可 用 一 个 四 元 组 表示 ， 如 (驱动 器 1， 柱 面 (cylinder)73， 磁 道 (rack)3， 扇 区 (secton)10)。 

文件 组 织 模块 (file-organization module) 涉 及 文件 系统 结构 、 文 件 格式 和 文件 位 置 ， 将 逻辑 地 址 
或 逻辑 块 号 转换 成 基本 文件 系统 所 用 的 物理 地 址 (磁盘 块 号 或 称 盘 块 号 )。 每 个 文件 的 罗 辑 块 按 从 0 
或 1 到 NN 的 顺序 编号 ， 一 般 罗 辑 块 号 与 物理 块 号 是 不 同 的 ， 因 此 需要 通过 翻译 来 定位 盘 块 号 。 文 件 
组 织 模块 也 包括 空闲 空间 管理 器 ， 用 来 跟踪 未 分 配 的 盘 块 并 分 配给 文件 使 用 。 


图 4-1 Linux 文件 管理 系统 的 结构 


最 后 ， 逻 辑 文 件 系统 dogic fle system) 管 理 元 数据 。 元 数据 包括 文件 系统 的 结构 数据 ， 而 不 包括 
实际 数据 (或 文件 内 容 )。 逻辑 文件 系统 根据 给 定 文件 名 来 管理 目录 结构 , 使 用 文件 控制 块 (File Control 
Block，FCB) 来 维护 文件 结构 。 文 件 控制 块 包 含 文件 的 信息 ， 如 拥有 者 、 权 限 、 文 件 内 容 的 位 置 。 
逻辑 文件 系统 也 负责 保护 和 安全 。 

文件 系统 接口 是 用 户 或 应 用 程序 操作 文件 的 方法 和 手段 ， 通 常 有 两 种 类 型 的 接口 : 一 类 是 命令 
接口 ， 使 用 户 可 通过 终端 命令 来 操作 文件 ， 如 mkdir、cp、mv、cat; 另 一 类 是 程序 接口 ， 支 持 应 用 
程序 操作 文件 ， 如 创建 文件 的 系统 调用 create、 打 开 文 件 的 系统 调用 open。Linux 环境 下 的 文件 系统 
编程 接口 又 称 文件 系统 调用 或 UNIX WO， 主 要 包括 open、close、lseek、read、write 等 系统 调用 函 
数 ， 本 章 稍 后 重点 介绍 。 


4.1.2 文件 1/O 库 函 数 


由 于 UNIX LO 提供 的 API 函数 不 够 丰富 ,在 某 些 场 景 下 直接 用 UNIX IO 库 函数 编程 ,显得 不 
够 方便 、 灵 活 。 因 此 ， 人 们 基于 UNIX VO 设计 了 多 套 可 方便 编程 、 使 IO 操作 高 效 执行 的 VO 库 。 
这 里 介绍 两 个 这 样 的 IO 库 : 标准 IO 库 和 RIO 库 。 

标准 IO 库 是 C 语言 规范 ANSI C 支持 的 文件 操作 函数 JO 库 。 它 将 一 个 打开 的 文件 模型 化 为 
一 个 流 ， 流 是 一 个 指向 FILE 类 型 的 结构 的 指针 。 每 个 程序 开始 时 都 有 三 个 打开 流 stdin、stdout 和 
stderr， 分 别 对 应 标准 输入 、 标 准 输出 和 标准 错误 输出 : 
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#include <stdio h> 

extem FILE *stdin; 。“/* 标准 输入 ， 对 应 描述 符 0 */ 

extem FILE *stdout 入 标准 输出 ， 对 应 描述 符 1 */ 

extem FILE +stderr 。 /* 标准 错误 输出 ， 对 应 描述 符 2 */ 

标准 IO 库 包 括 打 开 和 关闭 文件 的 函数 (fopen 和 fclose)、 读 写 数据 块 的 函数 (fread 和 fwrite)、 读 
写字 符 串 的 函数 (fgets 和 fputs)， 以 及 格式 化 IO 函数 (scanf 和 printD)， 使 用 用 户 级 缓冲 区 ， 读 写 效率 
高 。 一 般 支 持 C 语言 的 环境 都 支持 标准 IO 库 ， 包 括 Linux C 和 Windows C 环境 。 

RIO 库 是 由 Randy Bryant 为 弥补 系统 1O 在 读 文本 行 和 处 理 不 足 值 时 存在 的 缺陷 而 设计 的 .RIO 
库 在 用 户 态 设置 缓冲 区 ， 自 动 处 理 read/write 函数 的 不 足 值 ， 支 持 以 文本 行为 单位 读 取 数 据 ， 给 网 
络 应 用 编程 开发 带 来 极 大 便利 。 

图 4-2 给 出 了 三 类 函数 库 之 间 的 关系 。 


标准 IO 函数 


UNIX IO 函数 
(通过 系统 调用 访问 ) 


open read 
Write lseek 
stat close 


图 4-2 ”UNIXIO、 标 准 IJO 和 RIO 之 间 的 关系 


了 四] 系统 IO 概念 与 文件 操作 编程 


4.2.1 UNIX MO 
一 个 UNIX 文件 就 是 一 个 包含 m 个 字 节 的 序列 : 
Bo,B,,..., Bh..., Bn 
所 有 的 IO 设备 ， 如 网 络 、 磁 盘 和 终端 ， 都 被 模型 化 为 文件 ， 而 所 有 的 输入 和 输出 都 被 当 作对 
相应 文件 的 读 写 来 执行 。 这 种 将 设备 优雅 地 映射 为 文件 的 方式 ， 允 许 UNIX 内 核 引出 一 个 简单 、 低 
级 的 IO 操作 应 用 接口 ， 称 为 UNIX IO， 又 称 系统 IJO。 它 以 一 致 的 方式 来 执行 所 有 输入 和 输出 ， 
UNIX VO 包括 以 下 几 个 系统 调用 函数 : 
e ”文件 打开 函数 (open)。 应 用 程序 通过 调用 open 函数 来 要 求 内 核 打开 相应 的 文件 ， 宣 告 想 要 
访问 IO 设备 或 文件 。 内 核 返 回 一 个 称 为 文件 描述 符 的 非 负 整数 , 用 于 在 后 续 读 写 操作 中 标 
识 这 个 文件 。 内 核 记录 有 关 这 个 打开 文件 的 所 有 信息 ， 应 用 程序 只 需要 记 住 这 个 文件 描述 
符 。 每 个 进程 开始 时 都 有 三 个 打开 的 文件 : 标准 输入 (文件 描述 符 为 0)、 标 准 输出 (文件 描述 
符 为 1) 和 标准 错误 输出 (文件 描述 符 为 2)。 头 文件 <unistdh> 定 义 了 三 个 宏 SIDIN FILENO、 
STDOUT FILENO 和 STDERR FILENO， 用 来 代 蔡 文件 描述 符 的 值 0、1、2。 
e ”改变 当前 的 文件 位 置 函 数 (lseek)。 每 个 打开 文件 都 保持 着 一 个 读 写 位 置 ， 其 值 是 距离 文件 
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起 始 位 置 的 字 节 偏 移 量 ， 新 打开 文件 的 读 写 位 置 为 0， 随 读 写 操作 移动 ， 也 可 通过 调用 函数 
lseek 移动 到 任何 位 置 。 

e 文件 读 写 函 数 (ead/write)。 读 操作 就 是 从 文件 当前 读 写 位 置 丰 传递 xz>0) 个 字 节 到 内 存 ， 文 
件 读 写 指针 向 前 移动 n 个 字 节 ， 增 加 到 ktn。 给 定 一 个 大 小 为 m 字 节 的 文件 ， 当 > 时 ， 
执行 读 操作 会 触发 一 个 称 为 EOF(End Of File) 的 条 件 ， 应 用 程序 可 通过 检测 这 个 条 件 来 判断 
是 否 到 达 文 件 末 尾 ， 但 在 文件 结尾 并 没有 明确 的 “EOF” 符 号 。 

e 文件 关闭 函数 (closej。 当 应 用 程序 完成 对 文件 的 访问 之 后 ， 它 就 通知 内 核 关 闭 这 个 文件 。 作 
为 响应 ， 内 核 释放 文件 打开 时 创建 的 数据 结构 ， 并 将 这 个 文件 描述 符 恢复 到 可 用 的 描述 符 
池 中 。 无 论 一 个 进程 因为 何 种 原因 终止 ， 内 核 都 会 关闭 所 有 打开 文件 并 释放 它们 的 存储 器 
资源 。 

UNIX VO 对 文本 文件 和 二 进 制 文件 的 读 写 没有 任何 区 别 ， 因 为 它 在 实际 读 写 数据 时 ， 全 然 不 管 

数据 内 容 ， 每 次 在 内 存 和 文件 之 间 传 送 指 定数 量 的 字 节 。 


4.2.2 文件 打开 和 关闭 函数 


1. 文件 打开 函数 
进程 通过 调用 open 函数 来 打开 一 个 已 存在 的 文件 或 者 创建 一 个 新 的 文件 : 


open 函数 将 flename 转换 为 一 个 文件 描述 符 , 并 且 返 回 具 体 的 值 。 返回 的 文件 描述 符 总 是 进程 
中 当前 可 用 的 最 小 空闲 描述 符 。C 程序 在 执行 任何 读 写 操作 前 都 需要 先 执行 open 函数 以 打开 文件 ， 
后 面 的 文件 读 写 操作 都 用 返回 的 文件 描述 符 来 指明 要 操作 的 文件 。 

主要 参数 说 明 如 下 : 

(1) flags 

flags 参数 指明 进程 打算 如 何 访问 这 个 文件 ， 它 必须 包括 以 下 标志 之 一 

e O RDONLY: 只 读 。 

e 0 _WRONLY: 只 写 ， 如 果 文 件 非 空 ， 写 入 内 容 以 替换 要 写 入 位 置 的 数据 。 

e。 O_RDWR: 可 读 可 写 ， 如 果 文 件 非 空 ， 写 入 内 容 以 替换 要 写 入 位 置 的 数据 。 

例如 ， 下 面 的 代码 说 明了 如 何以 只 读 方式 打开 一 个 已 存在 的 文件 : 

fd=open("foo .txt". O_RDDNLY. 0): 

如 果 打开 方式 包括 写 操作 , flags 参数 还 可 以 通过 “ 按 位 或 ”操作 增加 以 下 标志 中 的 一 个 或 多 个 
为 写 操作 提供 一 些 额 外 指示 。 

e O_CREAT: 如 果 文 件 不 存在 ， 就 创建 一 个 新 的 文件 。 

e OTRUNC: 如 果 文 件 已 存在 ， 就 截断 它 。 

e 0O APPEND: 以 添加 方式 打开 文件 ， 在 每 次 写 操作 前 ， 设 置 文件 读 写 指针 到 文件 的 结尾 处 。 
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例如 ， 下 面 的 代码 以 添加 方式 打开 一 个 已 存在 文件 foo.txt， 写 入 内 容 以 添加 到 已 有 数据 之 后 : 

fd=open("foo.txt", O_ WRONLY|O_APPEND . 0): 

而 下 面 的 代码 则 以 截断 方式 打开 文件 foo.txt， 若 文件 中 存在 内 容 ， 则 覆盖 之 。: 

fd=open("foo.txt' , O_ WRONLY|O_TRUNC , 0): 

(2) mode 

调用 open 函数 打开 已 存在 文件 时 ， 参 数 mode 一 般 设置 为 0。 若 打开 一 个 不 存在 的 文件 ，open 
函数 就 会 创建 一 个 新 的 文件 ， 这 时 需要 通过 mode 参数 指定 新 文件 的 访问 权限 位 ， 和 否则 文件 访问 权 
限 为 全 0。mode 参数 的 值 可 以 是 一 个 3 位 的 八进制 数值 ， 也 可 由 表 4-1 所 示 的 符号 按 位 或 而 成 。 


表 4-1 访问 权限 位 ， 在 linux/stat.h 中 定义 


权限 mwx 表示 描述 

S_IRUSR I 一 — 表示 文件 所 有 者 拥有 读 权限 
S_IWUSR EB 表示 文件 所 有 者 拥有 写 权限 
S_IXUSR 一 — 表示 文件 所 有 者 拥有 执行 权限 
S_IRGRP 一 一 一 表示 同 组 用 户 拥 有 读 权 限 
S_IWGRP 二 表示 同 组 用 户 拥有 写 权限 
S_IXGRP 一 忌 一 表示 同 组 用 户 拥有 执行 权限 
S_IROTH 一 一 一 表示 其 他 用 户 拥 有 读 权限 
S_IWOTH 二 表示 其 他 用 户 拥有 写 权限 
S_IXOTH x 表示 其 他 用 户 拥有 执行 权限 


而 新 建文 件 的 权限 ， 还 受 新 建文 件 权限 掩 码 umask 的 影响 。 
umask 变量 中 为 1 的 位 是 不 允许 新 建文 件 拥有 的 权限 位 , 因此 使 用 带 mode 参数 的 open 函数 调 
用 来 创建 一 个 新 文件 时 ， 应 从 mode 参数 指定 的 权限 位 中 去 除 umask 中 的 权限 位 ， 文 件 的 实际 访问 
权限 位 被 设置 为 mode & ~umask。 很 多 Linux 系统 中 ,将 umask 的 默认 值 设置 为 八进制 数 0022( 以 0 
开始 的 数 为 八进制 数 )， 表示 同 组 用 户 和 其 他 用 户 都 没有 写 操作 ,这样 可 以 保护 用 户 创建 的 文件 免 遭 
他 人 有 意 或 无 意 修改 、 删 除 。 
假设 umask=S IWGRPIS IWOTH,， mode=S IRUSRIS IWUSRIS IRGRPIS IWGRPIS IROTHI| 
S_IWOTH， 计 算 新 建文 件 的 访问 权限 perm。 
解答 : 根据 表 4-1, umask=S_ IWGRP|S IWOTH 就 是 umask=0022, 二 进 制 表示 为 000 010 010b; 
mode= S_IRUSRIS IWUSR| S IRGRP|S IWGRPIS IROTH |S_IWOTH, 就 是 mode=0666， 
二 进 制 表示 为 110 110 110b。 
新 文件 的 实际 访问 权限 为 mode 与 umask 反 码 111 101 101 做 “ 按 位 与 ”运算 的 结果 : 
110 110110 
&111 101 101 
perm = 110100100 


运算 结果 相当 于 从 mode 中 去 除 掩 码 umask 指定 的 权限 位 ， 也 就 是 新 文件 权限 位 rw- r-- r--， 即 
perm= S_IRUSRIS IWUSRIS IRGRPIS 了 ROTH， 这 是 从 mode 的 权限 标志 rw- rw- rw- 中 减 去 umask 
对 应 标志 一 -w- -w- 后 得 到 的 结果 。 
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掩 码 umask 可 通过 命令 umask 查看 ， 用 带 -p 选项 的 umask 命令 修改 : 


S$ umask 
0022 
Sumask Dp 0066 
S$ umask 
0066 


也 可 在 程序 中 用 下 面 的 系统 函数 修改 : 


i 

es 

mode tumask(mode tmask); 

其 中 ， 参 数 mask 是 新 的 掩 码 ， 返 回 值 是 修改 前 的 掩 码 。 
和 思考 与 练习 题 4.1 已 知 mode 和 umask 的 值 ， 在 表 4-2 中 填写 open 函数 执行 后 新 文件 的 实 
际 权限 。 


表 4-2 权限 表 
mode | mask | 项 根 
om 
0666 


S IRUSRIS IWUSRIS IRGRPIS IWGRP|S IROTH 
下 面 是 一 个 带 mode 参数 的 文件 创建 实例 : 

#defineDEF MDDE S IRUSRIS IWUSR|S IRGRP|IS IWGRPIS IROTHIS IWOTH 

伺 =open('footxt',O_CREATIO_ TRUNCIO WRONLY, DEF MDDE): 

注意 : 

1) 在 Linux 系统 中 ,mode 参数 为 0 时 ,open 函数 调用 可 省 略 该 参数 ,而 简写 成 :int fd=open(char* 
filename, int flags): 

2) 带 mode 参数 的 open 函数 调用 也 可 写成 creat 函数 ， 语 义 更 加 直观 ， 比 如 : int fd=creat(char 
*filename,mode_t mode); 
到 ”思考 与 练习 题 4.2 根据 应 用 场景 ， 写 出 正确 的 open 函数 调用 (填写 表 4-3)。 若 创建 新 文件 ， 
则 新 文件 的 权限 为 rw-r--r--(umask0002)。 


表 4-3 ” 写 出 对 应 的 open 函数 调用 
应 用 场景 

(1) 某 程序 需要 将 操作 日 志 写 入 日 志文 件 “1.log”. 若 1log 不 存在 ， 
则 创建 之 ， 若 存在 ， 将 日 志 信息 追加 到 已 有 信息 之 后 。 
(2) 某 程序 需要 将 运行 结果 写 入 文件 “file.out”。 若 fle.out 原来 就 
有 数据 ， 则 路 盖 之 ， 若 原来 不 存在 ， 则 创建 之 。 
(3) 某 个 编辑 程序 要 打开 一 个 C 语言 程序 pl.c 进行 编辑 ， 若 pl.c 
不 存在 ， 则 创建 之 。 


open 函数 调用 
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2. 文件 关闭 函数 
文件 操作 完毕 后 ， 应 调用 close 函数 予以 关闭 ，close 函数 要 求 传 入 打开 文件 的 文件 描述 符 。 


#include <unistd h> 


int close(int fd); 
返回 值 : 若 成 功 ， 则 为 0; 车 出 错 ， 为 -1。 


4.2.3 ”文件 读 写 编程 与 读 写 性 能 改进 方法 
应 用 程序 是 通过 分 别 调用 read 和 write 函数 来 执行 输入 和 输出 的 。 


#include <unistd h> 
ssize tread(int fd , void *buf ,size tn): 


返回 值 : 若 成 功 ， 则 为 读 出 的 字 节 数 ， 若 遇 到 EOF， 则 为 0; 若 出 错 ， 为 -1。 


ssize t write(int fd , const void *buf size_ tn): 


返回 值 ， 若 成 功 ， 则 为 写 入 的 字 节 数 ， 若 出 错 ， 为 -1。 

read 函数 从 文件 得 的 当前 读 写 位 置 拷贝 最 多 n 个 字 节 的 数据 到 存储 器 位 置 buf， 返 回 值 - 1 表 
示 出 错 ， 而 返回 值 0 表示 EOF， 否 则 ， 返 回 值 表 示 的 是 实际 传送 的 字 节 数量 。read 函数 有 一 个 输入 
参数 类 型 size t 和 一 个 返回 值 类 型 ssize t。 二 者 有 些 区 别 ，size t 实际 定义 为 unsigned int,， 而 ssize_t 
实际 定义 为 nt， 因为 read 函数 的 返回 值 可 能 是 - 1， 是 有 符号 整数 类 型 ， 而 指定 的 写 入 数据 或 读 出 
数据 的 长 度 必须 是 非 零 整数 。 

write 函数 从 缓冲 区 buf 拷贝 最 多 7 个 字 节 的 数据 到 文件 伺 的 当前 读 写 位 置 , 并 移动 文件 指针 到 
写 入 内 容 之 后 ， 如 果 读 写 指针 在 文件 中 间 ， 写 入 内 容 将 覆盖 原 有 内 容 。 

如 果 我 们 把 write/read 函数 的 缓冲 区 指针 buf 看 成 内 存 地址 ，read、write 函数 调用 的 执行 效果 可 
用 图 4-3 表示 。write 函数 就 是 把 内 存 块 buf 的 数据 传送 到 文件 的 某 个 位 置 pos，read 函数 把 文件 读 
写 位 置 pos 处 的 数据 传送 到 内 存 块 buf 中， 二 者 都 需要 将 文件 读 写 指针 向 前 移动 n 个 字 节 。 


缓冲 区 地 址 。 缓冲 区 长 度 为 地 址 长 
buf n 个 字 节 ee 下 学 和 
主 存 主 存 | aaaaaaal 
\ 二 \ \ 
read(fd,buf,n)\ \ write(fd,buf,n) \ \ 
\ \ \ \ 
文件 内 容 _ 10110... -11010 文件 内 容 。 10110... 11010 
执行 read 前 文件 执行 read 后 文件 读 写 入 前 文件 读 写 写 入 后 文件 读 写 
读 写 位 置 为 pos 。 "个 字 节 写 位 置 为 postn 位 置 为 pos "个 字 节 位置 为 postn 


图 4-3 read/write 函数 调用 结果 
示例 程序 testrdwrc 展示 了 如 何 将 信息 写 入 非 空 文件 ， 其 中 输入 文件 infile 的 内 容 是 
"abcdefehijklmnopqrstuvwxyz"。testrdwr.c 文件 的 源 代码 如 下 : 


店 testrdwrc 代码 *#/ 
1 #include “wrapper.h" 


intmain0 
{intfd: 
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4 char buff100]: 

5 fd-open("infile".O_ RDWR.0): 

6 write(fd."1234",4); 

这 Tead(fdbuf 4): 

8 bufl4]=0; 让 给 从 文件 读 回 的 文本 数据 添加 串 结束 符 */ 
9 printf("“%s\n",buf): 

10 close(fd); 

ee} 

Sgcec -0 festrdwr testrdwr.c -L. -Iwrapper 
§ /estrdwr 

efeh 

Scat infile 

1234efehijkInmopqrstuvwxyz 


该 程序 的 第 5 行 用 O_RDWR 标志 调用 open 函数 ， 以 读 写 方式 打开 已 存在 文件 infile， 读 写 指 
针 位 于 文件 起 始 位 置 ， 其 值 为 0， 第 6 行 调用 write 函数 以 写 入 数据 ， 写 入 内 容 “1234” 覆 盖 了 文件 
infile 的 前 4 个 字符 ， 文 件 读 写 指针 也 向 前 移动 4 个 字 节 ， 第 7 行 调用 read 函数 以 读 入 接 下 来 的 四 
个 字符 “efgh”， 图 4-4 展示 了 执行 情况 。 


文件 读 写 位 置 为 0 文件 读 写 位 置 为 4 
write 执行 前 Tead 执 行 前 
文件 但 的 内 容 文件 伺 的 内 容 
组 站 区 地 下 Baf 。 级 区 长 为 绥 冲 区 地 址 缓冲 区 长 度 为 
缓 ? bE bu 第 buf 4 个 字 节 
= — i = 一 全 一 
We 
LN 
wrie(ti"1234"4) (2,” read(fd,buf,4) J DD 
vedh rnd 扒 和 后 的 [rpggefaj 
文件 但 的 内 容 入 状况 入 
文件 读 写 位 置 为 4 文件 读 写 位 置 为 8 


图 4-4 示例 程序 中 read/write 函数 调用 执行 后 的 结果 
虽然 在 这 里 infile 是 一 个 文本 文件 ， 如 果 它 是 一 个 二 进 制 文件 ， 读 写 方法 也 是 一 样 的 ， 但 为 使 
显示 结果 可 读 ， 一 般 应 打印 每 个 字 节 的 十 六 进 制 数值 。 
好 = 思考 与 练习 题 4.3 ”阅读 下 列 程序 代码 : 


#include <stdio.h> 

#include <sys/stath> 

#include <fent| h> 

intmain0 

出 
int fd: 
char buff100]: 
fd=open("data".O_RDWR): 
read(fd.buf.4): 
bufl4]="\0'; 片 给 从 文件 读 回 的 文本 数据 添加 串 结束 符 所 
write(fd,"1234".4): 
printf("%6s\n".buf): 
close(fd): 
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假定 文件 data 的 内 容 为 "abcdefehijklnmopqrstuvwxyz"， 请 问 : 

(1) 该 程序 的 输出 结果 是 什么 ? 

(2) 该 程序 执行 后 ， 文 件 data 的 内 容 是 什么 ? 

若 要 写 入 信息 的 文件 不 存在 ， 则 调用 open 函数 打开 文件 时 ， 应 添加 O_CREAT、O_TRUNSC 等 
标志 ， 指 示 open 函数 创建 该 文件 。feopyl.c 是 一 个 二 进 制 文件 复制 程序 ， 演 示 了 如 何 创建 并 将 信息 
写 入 新 文件 ， 源 码 如 下 : 


旋 feopyl.c 代码 *#/ 

#include "wrapper.h" 

2 intmain0 

| 

4 char cc; 

| intin , out; 

6 in=open("filein", O_ RDONLY., 0): 
7 out = open("file.out", O_ WRONLY|O_CREATIO_TRUNC.0666 ); 
8 while(read(in.&c , 1)— 1) 

9 write(out , &c , 1 ); 

10 close(in); 

11 close(out): 

12 exit (0) ; 

i320 


该 程序 的 第 7 行 在 打开 文件 file.out 时 用 了 三 个 标志 O_WRONLY、O_CREAT、O_TRUNC,， 
O_WRONLY 表示 以 只 写 方式 打开 ，O_CREAT 表示 文件 不 存在 时 创建 之 ，O_TRUNC 表示 文件 原 
来 存在 时 清除 其 内 容 。 

第 8 行 在 循环 条 件 表 达 式 中 调用 read 函数 ， 从 文件 flein 读 入 一 个 字 节 ， 如 果 还 有 未 读数 据 ， 
返回 值 应 为 1，while 条 件 为 tue， 第 9 行将 读 入 字 节 e 写 入 文件 file.out。 如 果 第 8 行 的 read 函数 调 
用 已 到 达 文 件 末尾 ,返回 值 为 EOF( 即 数值 0, while 条 件 为 false, 表明 flein 的 全 部 数据 已 写 入 file.out。 

需要 注意 的 是 ， 该 程序 用 变量 c 作为 数据 读 写 缓冲 区 ， 因 此 取 其 地 址 &c 作为 第 8 行 read 调用 
和 第 9 行 write 调用 的 第 二 个 参数 。 又 由 于 变量 c 只 能 存放 一 个 字 节 的 数据 ， 因 此 read/write 函数 调 
用 的 第 三 个 参数 都 是 1， 表 示 每 次 最 多 读 写 一 个 字 节 的 数据 。 

接 下 来 先 用 gcc 命令 编译 fcopyl.c, 产生 可 执行 程序 fcopy1; 用 dd 命令 以 /dev/zero 为 输入 设备 ， 
创建 所 有 字 节 都 初始 化 为 0 的 二 进 制 数据 文件 flein， 每 次 复制 一 块 ， 块 大 小 为 bs=1024B， 块 数 为 
count=2048， 输 入 数据 文件 大 小 为 2MB; 然后 执行 fcopy1。 

Sgce -0 feopyl feopyle -TL -wrapper 

Sdd jhewserooffilein bs=1024 count=2048 

Sl 1 filein 

-IW-IW-I— 1 can can 2097152 Mar 28 02:58 filein 

$ /eopyl 

二 进 制 文件 的 内 容 无 法 用 more、cat 等 命令 查看 ， 用 od 命令 显示 其 字 节 值 又 不 方便 。 所 以 我 们 
用 diffdifference) 命 令 检查 源 文件 flein、 目 的 文件 fie.out 的 内 容 是 否 完全 相同 ， 进 而 检验 fcopyl 
是 否 正 确 执行 。 

Sail filein fileout 
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该 命令 无 任何 输出 ， 表 明 执 行 正确 ，file.out 就 是 fle.in 的 副本 。 

最 后 ， 还 需要 检查 新 文件 fleout 的 权限 是 否 设置 正确 。 先 查看 umask 值 : 

S$ umask 

0022 

由 于 open 函数 调用 的 参数 mode=0666， 新 建文 件 file.out 的 权限 应 该 是 perm=mode 有 & 
~umask=0666 & ~0022=0644。 用 ls -1 命令 查看 file.out 的 权限 : 

Sls -1 fileonut 

-IW-I--I— 1 can can 2097152 Mar 28 02:59 file.out 

确实 是 0644。 

用 fcopy1 程序 复制 一 个 2MB 的 文件 按理 说 应 该 很 快 ， 瞬 间 完 成 ， 但 明显 感觉 实际 执行 偏 慢 。 
现在 用 time 命令 执行 “Yeopy1”， 测 量程 序 的 执行 时 间 : 

S$ time feopy1 

real Om9.27s 

User Om0.98s 

sys Om7.77s 

测 得 结果 中 ，user 表示 在 用 户 态 运 行 花 0.98 秒 ，sys 表示 在 核心 态 运行 花 7.77 秒 ，real 表示 实 
际 耗 时 8.27 秒 。 

下 面 分 析 程 序 fcopy1 执行 慢 的 原因 。 虽 然 计算 机 读 写 一 个 字 节 的 速度 是 非常 快 的 ， 但 IO 函数 
调用 需要 将 程序 控制 从 用 户 程序 切换 到 系统 内 核 ， 再 切换 回来 ， 每 次 read/write 调用 需要 执行 成 百 
上 千 条 指令 。 在 fcopyl.c 中 ， 每 复制 一 个 字符 都 需要 调用 一 次 read 函数 和 一 次 write 函数 ， 共 需要 
执行 1024*2048 次 read 和 write 函数 调用 ， 数 据 复制 效率 低 应 该 是 程序 耗 时 的 原因 。 要 提高 程序 执 
行 效率 ， 应 大 幅 减少 read/write 调用 次 数 。 

现在 通过 每 次 复制 一 个 数据 块 来 进行 优化 ， 改 进 后 的 程序 为 fropy2.c， 它 每 次 复制 长 度 为 IKB 
的 数据 块 ， 源 码 如 下 : 
雍 feopy2.c 源 码 */ 
1 #include "wrapper.h" 
2 intmain0 
| 
4 charblock[1024]: 
5 intin,out; 
6 intnread: 
7 in=open("filein".O_ RDONLY.,0): 
8 out=open( "file.out",O_ WRONLY|O CREATIO TRUNC.0666): 
9 while((nread=read(in. block, sizeoftblock))) >0) 
10 ”write(out ,block ,nread) : 


11 close(in): 
12 close(out): 
13 exit(0):; 

La 
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首先 删除 旧 的 输出 文件 ， 然 后 以 测 时 方式 运行 这 个 程序 ， 用 FORMAT 参数 以 不 同 格式 显示 执 
行 时 间 : 

Srm fileout 

$ FORMAT="" time .Meopy2 

0.00user 0.01system 0:00.01elapsed 80%CPU (0avgtext+0avgdata 956maxresidenbk 

Oinputs+4096o0utputs (Omajor+54minor)pagefaults Oswaps 

Sls file.* 

-IW-IW-I~ 1 can can 2097152 Mar 28 03:08 file.in 

-IW-IW-I~ 1 can can 2097152 Mar 28 03:11 file.out 


可 以 看 到 ， 改 进 后 的 程序 只 花 0.01 秒 时 间 就 完成 了 2MB 文件 的 复制 ， 因 为 这 一 次 只 需要 大 约 
2048 次 read 和 write 函数 调用 ， 而 优化 前 需要 执行 1024*2048 次 函数 调用 。 测 试 结果 表明 : 与 基本 
的 运算 操作 相 比 ，IO 函数 开销 很 大 , 减少 IO 函数 的 调用 次 数 有 时 会 使 运行 速度 加 倍 甚至 呈 数 量 级 
提高 。 

把 输入 文件 flein 加 大 十 倍 ， 变 成 20MB， 再 次 执行 复制 程序 : 

Sad if/heverooffilein bs=1024 count=20480 

S$ TIMEFORMAT=""time /feopy2 

0.00user 0.11system 0:00.12elapsed 90%CPU (0avgtext+0avgdata 912maxresidenbk 

Oinputs+40960o0utputs (Omajor+55minor)pagefaults Oswaps 

运行 用 时 仅 0.12 秒 。 

因此 ， 一 次 waite 或 read 函数 调用 传输 的 字 节 数 不 宜 太 少 ， 否 则 会 严重 影响 文件 读 写 速度 ， 一 
般 安 排 每 次 读 写 几 KB 就 可 使 文件 读 写 获得 高 性 能 。 但 每 次 读 写 的 字 节 数 也 不 要 太 大 ， 否 则 会 带 来 
较 大 的 内 存 开销 。 


4.2.4 文件 定位 与 文件 内 容 随 机 读 取 


lseek 系统 调用 函数 调整 文件 读 写 指针 的 位 置 ， 设 置 文件 的 下 一 个 读 写 位 置 ， 读 写 指针 既 可 被 设 
置 为 文件 中 的 某 个 绝对 位 置 ， 也 可 以 设置 为 相对 于 当前 位 置 或 文件 末尾 的 某 个 位 置 。 

#include <unistdh> 

#include <sys/typesh> 


off set lseek(intfd, off toffset, int whence): 


其 中 ,offset 参数 用 来 指定 位 置 ,whence 参数 定义 偏 移 量 的 设置 方式 , whence 可 取 下 列 值 之 一 。 

e@ SEEK_SET: 从 文件 起 始 位 置 移动 ， 结 果 读 写 指针 位 置 为 offset。 

ee SEEK CUR: 从 当前 位 置 移动 ， 结 果 为 当前 读 写 指针 值 +offset。 

e。 SEEK END: 从 文件 末尾 移动 ， 结 果 为 文件 长 度 +offset。 

若 位 置 计算 结果 小 于 0， 则 lseek 执行 失败 ， 读 写 指针 不 移动 ， 函 数 返 回 值 为 - 1; 若 位 置 计算 
结果 超过 文件 长 度 ， 则 对 文件 大 小 按 指针 值 进行 扩展 。 

正确 执行 时 , lseek 返回 从 文件 头 到 文件 指针 被 设置 处 的 字 节 偏 移 值 , 失败 时 返回 - 1。 参 数 offset 
的 类 型 是 一 种 与 具体 实现 有 关 的 整数 类 型 ， 定 义 在 头 文件 sys/typesh 中 。 

比如 ， 假 设 当前 读 写 指针 位 置 为 90， 文 件 长 度 为 100 字 节 ， 执 行 “lseek(fd.20，SEEK CUR)” 
后 ， 指 针 位 置 为 70。 
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旨 ”思考 与 练习 题 44 假定 当前 读 写 指针 位 置 为 第 50 字 节 ， 文 件 长 度 为 100， 计 算 执行 表 4-4 


中 操作 后 的 指针 值 。 
表 4-4 计算 指针 位 置 
定位 前 位 置 定位 操作 定位 后 指针 位 置 
50 lseek(fd.20.SEEK_SET): 
50 lseek(fd.-20.SEEK_SET): 
50 Iseek(fd.-20.SEEK_CUR): 


50 lseek(fd.20.SEEK_END): 


50 lseek(fd.120.SEEK_END): 
50 lseek(fd.-120.SEEK_CUR): 


通过 调用 lseek 函数 ， 一 个 C 程序 可 随时 从 文件 指定 位 置 读 写 数据 。testseek.c 是 一 个 编程 实例 ， 


它 读 出 文件 infile 中 字 节 10~ 字 节 14 的 五 个 字符 ， 并 显示 出 来 ， 同 时 将 这 五 个 字符 替换 成 
"12345"。 


字符 串 


尾 testseek.c 代码 */ 


#include "wrapper.h" 

2 intmain0 

3 《 

4 chars1[6],s2[6]; 

5 int fd; 

6 fd=open("infile" ,O_RDWR. 0); 
中 lseek(fd,10, SEEK_SET): 

8 read(fd, s1 , 5): 

9 sl[5]"\0'; 

10 ”printft" 读 出 的 内 容 是 : 9%sm"s1): 


12 strepy(s2, "12345"): 
13 lseek(fd.-5, SEEK_CUR): 
14 write(fd , s2 ,5 ): 
15 Close(fd): 

16 exit (0) : 

1 


第 7 行 的 lseek 调用 将 文件 指针 设置 为 10, 第 8 行 的 read 函数 从 当前 位 置 读 取 5 个 字 节 ， 


行将 文件 指针 往 回 移动 5 个 字 节 ， 回 到 位 置 10， 再 从 缓冲 区 s2 写 5 个 字 节 到 文件 。 
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阅读 该 程序 需要 注意 两 点 : (1) 在 该 程序 中 ，sl 和 s2 都 是 字符 数组 ， 数 组 名 就 是 指向 数组 第 一 
个 元 素 所 在 内 存单 元 的 指针 , 所 以 read 和 write 函数 分 别 直接 用 字符 数组 名 s1、s2 作为 内 存 缓冲 区 ; 


(2) 虽 然 字符 数组 sl 仅 从 文件 infile 接收 5 个 字 节 ， 但 第 4 行将 该 数组 定义 为 6 个 元 素 长 ， 因 


行 需要 给 读 入 的 数据 增加 一 个 串 结束 符 \0',， 以 便 第 10 行 能 正确 显示 读 入 的 字符 。 
编译 并 执行 程序 : 
Scat infile 
ABCDEFGHIKLMNOPQRST 


Sgcc -0 festseek testseekc -L. -Iwrapper 
S$ /estlseek 
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读 出 的 内 容 是 : KLMNO 


好 = 思考 与 练习 题 4.5 分 析 程 序 testseek.c 执行 后 ，infile 文件 的 内 容 是 什么 并 进行 验证 。 

结 7 思考 与 练习 题 4.6 ”创建 测试 文件 infile， 内 容 为 rabcdefghijklmnopqrstuvwxyz"; 写 一 个 程序 ， 
在 文件 末尾 追加 一 个 指定 字符 品 ,在 开始 位 置 写 入 字符 人 ,在 指定 位 置 (20) 写 入 字符 '&'; 请 问 程序 执行 
后 infile 文件 的 内 容 是 什么 ? 

多 思考 与 练习 题 4.7 编写 一 个 程序 ， 创 建 一 个 大 小 为 100MB 的 大 文件 。 

结 思考 与 练习 题 4.8 ”分 析 以 下 程序 执行 后 ， 文 件 data 的 大 小 是 多 少 ? 


fd=open("data",O_WRONLYIO_CREATIO_TRUNC.0777): 
lseek(fd,12345678.SEEK_SET): 
write(fd,&ch.1); 
close(fd); 
} 


4.2.5 任意 类 型 数据 的 文件 读 写 


由 前 面 的 图 4-3 可 知 ，read、write 函数 在 内 存 和 文件 之 间 传 输 一 个 数据 块 ， 这 个 数据 块 在 内 存 
中 的 地 址 为 buf， 在 文件 中 的 位 置 为 pos。 这 个 数据 块 位 于 内 存 中 时 ， 其 内 容 可 以 是 任何 类 型 ， 如 整 
型 、 浮 点 型 、 字 符 串 、 数 组 、 结 构 体 、 联 合体 ， 因 此 ，UNIX VO 可 以 实现 任意 类 型 数据 的 文件 读 写 
功能 。 

假设 我 们 用 Tvar 定义 了 一 个 类 型 为 工 的 变量 var， 则 该 变量 所 在 内 存 块 的 地 址 为 &var, 可 将 其 
转换 成 void * 类 型 ， 该 内 存 块 的 长 度 为 sizeoftT)， 所 以 将 变量 var 的 值 写 入 文件 蕊 当前 位 置 的 write 
函数 调用 为 write(fd,(void*)&var,sizeof(T))。 同 样 ， 将 保存 在 文件 当前 位 置 的 变量 var 的 值 读 回 内 存 
的 read 函数 调用 应 为 read(fd,(void*)&v, sizeof(T))。 该 过 程 如 图 4-5 所 示 。 

buf=(void*)&var n=sizeof(T) 


主 存 hy 
write(fd.,(void*)& Ver. Tead(fd.(void*)&var. 
sizeof(T)) siofD) 
文件 亿 

一 一 一 下 
读 写 前 文件 读 写 ma 个 字 节 ” 读 写 后 文件 读 写 
位 置 为 pos 位 置 为 postn 


图 4-5 将 一 个 类 型 为 T 的 变量 var 写 入 和 读 出 文件 乌 的 方法 


比如 ,要 将 一 个 浮 点 数 变量 (float 伟 123.45677) 的 值 写 入 文件 乌 , 则 write 函数 调用 可 以 是 write(fd， 
(void)&f sizeoftfloab); 要 从 文件 乌 的 当前 读 写 位 置 读 出 一 个 整 型 值 赋 给 整 型 变量 (int k)， 则 read 
函数 调用 可 写成 read(fd, (void) &k sizeoftk))。 

很 多 时 候 ， 我 们 需要 将 一 个 元 素 类 型 为 工 的 数组 var( 假 定 定义 为 Tvar[N]) 写 入 文件 ， 这 可 通过 
每 次 写 入 一 个 元 素 的 循环 来 实现 。 下 面 的 structw.c 和 structr.c 两 个 程序 展示 了 如 何 将 结构 体 数组 变 
量 的 值 写 入 文件 ， 以 及 如 何 从 文件 中 读 出 保存 好 的 结构 体 变量 。 
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上 # 结构 体 structw.c 的 程序 源码 */ 


i #include"wrapper.h" 

2 #include<fentl h> 

3 ”typedef struct_Employee {// 员 工 记录 

4 char name[20]: 

5 unsigned int age: 

6 float wage: 

7 。 char dept[20]: 

8 } Employee; 

9 intmain0 

10 { 

11 Employee emps[2]F{{ " 张 三 ",20.2000, "人 事 部 "}, { " 李 四 ".25.3000, "开发 部 "}}: 
12 intfdi: 

13 fd=open("data",O_ WRONLY|O_CREATIO_TRUNC.0777): 
14 for(i=0:1<2:i++) 

15 write(fd,(void *) &emps[i],sizeof(Employee)): 
16 close(fd): 

i 

上 # 结构 体 structr.c 的 程序 源码 */ 

1 #include"wrapper.h" 

2  #include<fentlh> 

j typedef stuct_Employee { 

4 char name[20]: 

Wnsigned int age: 

6 float wage: 

zh char dept[20]: 

8 } Employee: 

9 ”intmain0 

10 { 

11 Employee emp: 

12 int fdi: 

13 fd=open("data",O_RDONLY., 0): 

14 for(i=0:i<2:iH) { 

15 read(fd.(void *) &emp.sizeof(Employee)): 
16 printft"%s %d %f %s\n",emp.name,emp.age.emp.wage.emp.dept): 
1 } 

18 close(fd): 

19 } 


structw.c 将 两 条 员工 记录 写 入 文件 data。 其 中 , 第 15 行 的 write(fd.(void *) &emps[i], sizeofEmployee)) 
将 员工 记录 emps[j] 的 内 容 写 入 文件 得， 第 二 个 参数 是 记录 emps[] 的 地 址 ， 第 三 个 参数 是 记录 的 
长 度 。 其 实 ， 在 该 程序 中 ， 也 可 以 不 用 循环 ， 用 一 个 write 调用 将 全 部 两 条 员工 记录 写 入 文件 , 方 


法 是 将 结构 体 数组 作为 第 二 个 参数 传 给 waite 函数 ， 将 两 条 记录 所 在 内 存 


区 域 的 长 度 


2*#sizeofEmployee) 作 为 第 三 个 参数 传 给 write 函数 ， 即 这 样 调用 write 函数 : write(fd,(void semps， 
2*sizeof(Employee))。 
strutctr.c 从 文件 data 中 读 出 员工 信息 并 显示 出 来 。 第 15 行 接收 结构 体 变量 emp 并 作为 读 入 数 


据 的 缓冲 
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区 , 每 次 调用 read 函数 从 文件 读 一 条 记录 到 变量 emp 中 ,然后 输出 显示 。 该 程序 执行 成 功 
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的 前 提 是 : 事先 已 经 知道 文件 data 的 哪个 位 置 写 入 了 员工 记录 。 如 果 只 需要 读 出 第 二 条 记录 ， 则 应 
该 先 调用 lseek 调整 文件 指针 ， 由 于 第 二 条 记录 距离 文件 首部 的 偏 移 量 为 一 条 记录 长 度 ， 因 此 调用 
方法 为 lseek(fdsizeofEmployee).SEEK SET)。 需 要 注意 的 是 ， 必 须 在 写 入 某 个 变量 的 内 容 前 ， 记 录 
文件 指针 位 置 。 这 样 在 读 回 变量 值 前 ， 才 能 调用 lseek 以 正确 设置 文件 指针 。 
在 这 里 , 存 入 文件 data 的 数据 是 多 个 结构 体 而 不 是 字符 串 , 因此 文件 data 不 是 文本 文件 .用 cat、 
more 等 命令 查看 其 内 容 时 ， 显 示 结 果 可 能 是 乱码 。 
有 时 ， 我 们 要 读 写 文件 的 数组 规模 很 大 (比如 100MB)， 而 数组 元 素 却 很 小 ， 仅 数 个 字 节 。 若 每 
个 read/write 函数 调用 传输 一 个 元 素 , 文件 读 写 效率 就 会 很 低 , 这 时 可 以 考虑 每 次 传输 一 个 数 KB 大 
小 的 数据 块 。 
呆 ” 思考 与 练习 题 4.9 如果 用 gedit 打开 程序 structw.c 创建 的 文件 data, 是 否 会 包含 乱码 ,为 什么 ? 
请 实际 验证 。 
和 思考 与 练习 题 4.10 ”stmuctrw.c 的 写 文件 方案 是 将 变量 所 在 存储 区 的 内 容 直 接 写 入 文件 , 另 一 种 
写 入 方案 是 先 将 每 个 字段 转换 成 字符 串 ， 再 写 入 文件 。 两 种 方案 产生 的 文件 大 小 有 何 差 异 ? 
2 思考 与 练习 题 4.11 阅读 下 面 的 程序 代码 : 
intmain0 { 
int fd1,fd2; 
char *s12="50000"; short i12=50000; 
fdl=open("fl",0_ WRONLY., 0777); 
fd2=open("f2",0_ WRONLY., 0777); 
write(fd1,s12,5); write(fd2, &i12, 2): 
close(fd1): close(fd2): 
} 
请 问 ， 所 和 也 中 的 哪个 文件 在 显示 时 可 能 会 出 现 乱码 ， 为 什么 ? 
和 思考 与 练习 题 4.12 ”编写 程序 ， 把 下 列 变量 的 值 写 入 文件 datal， 然 后 读 回 显示 。 
unsigned char a=128: unsigned short c=32700; 
unsigned char ar[5]={129.254,131,112,178}: 


计算 这 些 变量 占用 的 内 存 容量 ， 要 求 文件 大 小 不 大 于 变量 占用 的 内 存 容 量 。 


4.2.6 用 文件 读 写 函 数 操作 设备 


Linux 系统 将 设备 看 成 文件 ， 可 以 用 UNIX VO 函数 打开 设备 以 获得 文件 描述 符 ， 然 后 通过 文件 
描述 符 从 设备 读数 据 或 向 设备 写 数据 。 一 个 典型 的 例子 就 是 读 写 每 个 进程 专用 的 标准 输入 设备 (键盘 
输入 )、 标 准 输出 设备 (终端 窗口 )、 标 准 错误 输出 设备 (终端 窗口 )， 这 三 个 设备 文件 已 经 在 程序 启动 
时 由 系统 打开 ， 文 件 描述 符 分别 为 0、1、2， 相 应 的 宏 为 STDIN FILENO、STDOUT FILENO、 
STDERR FILENO。fcopy3.c 是 用 UNIXIO 读 写 标准 输入 、 标 准 输出 的 示例 。 

#feopy3.c 源码 */ 

L #include "wrapper.h" 

2 intmain(void) 

50 

4 char c: 

到 while((read(STDIN_FILENO. &c.1D) 一 1) 
6 write(STDOUT FILENO. &c .1): 
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7 exit(0): 

SEE 

下 面 编译 和 执行 程序 : 

Sgcec -0 feopy3 feopy3.c -TL -Iwrapper 
§ Meopy3 

Hello 

Hello 

Copy string from STDIN to STDOUT 

Copy string from STDIN to STDOUT 

2 


该 程序 将 从 标准 输入 (文件 描述 符 为 0) 键 入 的 字符 串 复制 到 标准 输出 (文件 描述 符 为 1 )， 用 户 输 
入 一 行 完整 信息 并 键入 回 车 键 后 ， 把 输入 文本 行 提交 系统 ,程序 开始 读 取 操 作 , 每 次 复制 一 个 字符 ， 
结果 就 是 输入 一 行 ， 输 出 一 行 。 

其 实 ，Linux 系统 的 每 个 命令 终端 窗口 都 有 设备 文件 名 ， 打 开 两 个 命令 终端 窗口 ， 可 用 tty 命令 
查看 各 自 的 设备 名 ， 假 定 分 别 为 /devpts/0 和 /dev/pts/1， 并 用 ls 命令 核实 /dev/ 目 录 下 确实 存在 这 两 个 
设备 文件 (当然 可 能 还 包含 其 他 终端 设备 文件 )， 如 图 4-6 所 示 。 


/dev/pts/© /dev/pts/1 
[can@ubuntu:-$ can@ubuntu:-$ 1s /dev/pts 
11 14 18 26 23 26 6 ptmx 
2 5 1 2 2 3 8 
eM 22 25 5 9 
lcan@ubuntu:~$ 


~”@ 


4-6 Linux 终端 设备 名 查看 方法 


这 样 ， 我 们 也 可 以 通过 UNIX IO 从 其 他 终端 窗口 读 入 文本 或 向 其 写 入 文本 。 程 序 fcopyex.c 在 
一 个 终端 窗口 中 运行 ， 从 标准 输入 读 入 信息 ， 写 入 另 一 个 终端 窗口 。 


雍 feopyex.c 源 代码 */ 


1 #include <stdioh> 

2  #include <unistdh> 

3  #include <fcntLh> 

4  #include <stdlibh> 

5 intmain(void) 

6 { 

Tn char c: 

8 int 全: 

9 fd=open("/dev/pts/1".0_WRONLY.0): 
10 while((read(STDIN_FILENO., &c . 1))—1) 
11 write(fd , &e, 1): 

12 exit(0): 

下 人 


该 程序 在 /dev/pts/0 下 执行 ， 输 入 信息 已 被 写 入 终端 窗口 /dev/pts/1， 图 4-7 是 运行 结果 截图 。 
有 * 思 考 与 练习 题 4.13 写 一 个 程序 ， 从 一 个 终端 窗口 读 入 文本 ， 写 入 另 一 个 终端 窗口 ， 输 入 
终端 窗口 和 输出 终端 窗口 都 不 是 运行 程序 的 终端 窗口 。 
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Terminal 
can@ubuntu:~$ tty -an@ubuntu:~$ tty 
dev/pts/1 
an@ubuntu:~$ hello 
orld 


Nhello 
ee 来 自 /devipts/0 的 信息 


4-7 用 write 函数 将 数据 写 入 终端 设备 结果 截图 


Linux 系统 的 文件 共享 、 重 定向 、 管 道 都 是 通过 对 打开 文件 内 核 数据 结构 的 操作 来 实现 的 。 如 
果 不 清楚 内 核 是 如 何 表示 打开 文件 的 , 这 些 概 念 和 原理 会 很 难 理解 , 也 就 很 难 进行 相关 的 应 用 编程 。 
内 核 用 三 个 相关 的 数据 结构 来 表示 打开 的 文件 。 

(1) v-node 表 (v-node table) 

Linux 将 打开 文件 的 属性 信息 保存 在 索引 节点 对 象 tnode objecb 中 ， 索 引 节点 对 象 又 称 为 
v-node。 文 件 属性 信息 包括 文件 名 、 文 件 大 小 、 访 问 权限 、 修 改 时 间 、 文 件数 据 盘 块 地 址 等 ， 在 磁 
盘 上 保存 在 文件 控制 块 ECB，File Control Blocl) 中 。Linux 系统 的 文件 控制 块 称 为 索引 节点 ，stat 
结构 体 类 型 详细 列 出 了 所 有 文件 属性 ， 其 中 的 st_ mode 成 员 包 括 文件 类 型 和 访问 权限 ，st_size 成 员 
为 文件 大 小 。 由 于 v-node 可 能 被 多 个 其 他 对 象 引 用 ， 因 此 需要 添加 打开 次 数字 段 G_count)。 系 统 的 
所 有 v-node 构成 一 个 v-node 表 。 

(2) 文件 表 (file table) 

Linux 将 打开 文件 信息 存储 在 文件 对 象 (file object) 中 ， 又 称 file 结构 ， 主 要 成 员 包 括 打 开 方 式 
(f mode)、 读 写 指针 (f pos)、 引 用 计数 (f_ counb 三 个 字段 ， 其 中 引用 计数 记录 指向 结构 体 的 指针 数 。 
对 一 个 文件 执行 一 次 打开 操作 ， 就 会 创建 一 个 文件 对 象 ， 系 统 的 所 有 文件 对 象 组 成 一 个 文件 表 。 

(3) 描述 符 表 (descriptor table) 

每 个 进程 都 有 一 个 独立 的 文件 描述 符 表 (descriptor table) ， 数 据 类 型 定义 是 struct file 
*fd_array[NR_OPEN_DEFAULT], 是 指向 文件 对 象 的 指针 数组 UNIX VO 用 描述 表 项 的 索引 号 作为 
open 系统 调用 函数 的 返回 值 ， 称 为 文件 描述 符 (descriptor)。 其 后 的 文件 操作 都 使 用 文件 描述 符 来 定 
位 文件 对 象 ， 进 而 定位 v-node 对 象 来 获取 文件 属性 。 


4.3.1 文件 描述 符 和 标准 输入 输出 


4-8 展示 了 内 核 文件 IO 数据 结构 的 一 个 示例 。 描 述 符 表 最 多 有 255 个 表 项 ， 每 个 表 项 保存 
一 个 指向 文件 对 象 的 指针 ， 而 文件 对 象 又 有 一 个 指向 v-node 对 象 的 指针 。 

程序 开始 时 , 文件 描述 符 0、1、2 分 别 被 标准 输入 (stdin)、 标准 输出 (stdoub 和 标准 错误 输出 (stderD) 
占用 , 在 进程 启动 前 由 系统 设置 好 ， 它 们 指向 的 文件 对 象 分 别 指向 键盘 设备 和 监视 器 设备 (或 终端 窗 
口 ) 的 vnode 对 象 。UNIX 系统 的 scanf、getchar、gets 等 系统 函数 实际 上 是 一 种 特殊 的 读 文件 操作 ， 
它们 从 文件 描述 符 0 读 入 数据 ， 由 于 描述 符 0(stdin) 关 联 了 键盘 设备 vnode,， 因 此 这 些 函数 就 从 键盘 
读 入 数据 ,同样 , printf、putchar、puts 函数 是 一 种 特殊 的 写 文件 操作 , 它们 将 输出 写 入 描述 符 1(stdou0)， 
而 程序 产生 的 错误 输出 被 系统 送 往 描 述 符 2(stderr)。 由 于 描述 符 1、2 最 终 都 关联 到 监视 器 设备 的 
v-node， 因 此 程序 产生 的 正常 输出 和 出 错 信息 都 在 监视 器 (终端 窗口 ) 中 显示 。 程 序 刚 启动 时 ， 从 3 
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开始 的 文件 描述 符 全 部 空闲 ， 函 数 调用 open 的 返回 值 从 3 开始 往 后 递增 。 


1 fd1=open("f1",O RDWR); | 文件 表 (file table， v-node 表 
1 fd2=open("D2",); 1 ”整个 系统 一 张 表 ) (整个 系统 一 张 表 ) 
| f=open(): | 
| 
文件 描述 符 表 (每 
个 进程 一 张 表 ) 
fd array 
标准 输入 0 
标准 输出 1 
标准 错误 输出 ”2 
fdl 3 
fa2 4 
fd3 5 读 写 位 置 
引用 计数 refen=1 | A 


4-8 ”执行 open0 函 数 调用 后 的 内 核 文件 VO 数据 结构 ，open 函数 调用 的 返回 值 从 3 开始 递增 


4.3.2 文件 打开 过 程 


当 程序 中 执行 open 函数 打开 文件 时 ， 系 统 首先 检查 文件 的 v_node 是 否 存在 ， 若 不 存在 ， 则 首 
先 为 其 创建 v node， 将 文件 的 属性 从 外 存 读 入 v-node; 然后 ， 创 建 其 文件 对 象 ， 设 置 读 写 方式 、 读 
写 位 置 、v-node 指针 ， 将 访问 计数 器 置 为 1; 最后， 在 进程 的 描述 符 表 中 找到 索引 号 最 小 的 空闲 表 
项 ， 在 其 中 填 入 文件 对 象 的 指针 ， 返 回 描述 符 表 项 的 索引 号 。 

下 面 的 程序 fdtest.c 在 启动 时 ， 文 件 描述 符 0、1、2 已 经 分 配给 stdin、stdout、stderr 三 台 设备 ， 
从 3 以 后 的 文件 描述 符 为 空闲 , 三 个 open 函数 以 读 写 方式 打开 文件 。 假 设 用 户 对 当前 目录 具有 写 权 
限 ， 则 open 函数 调用 都 能 成 功 ，open 函数 依次 选取 下 一 个 空闲 的 文件 描述 符 ， 分 配给 文件 刀 、 他 、 
仿 ， 因 此 输出 为 “f41=3 f42=4 fd3=5”。 


此 fatestc 源 代码 */ 

i #include "wrapper.h" 

2 intmain0 

3 { 

4 int fd1,fd2.,fd3; 

5 fdl=open("f1",0_RDWRIO_CREAT.0777):; 
6 fd2=open("f2".0_RDWRIO_CREAT.0777): 
四 fd3=open(" 人 名" .O_RDWRIO_CREAT.0777): 
8 Printf("fdl=%d fd2=%d fd3=%d\n",fd1,fd2,fd3): 
9 close(fdl): 

10 close(fd2): 

11 close(fd3): 

wy 

下 面 进行 测试 验证 : 

Sgcc-o fitest ftestc -L. -wrapper 

$ /Mitest 
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fdl=3 fd2=4 fd3=5 


彩 ” 思 考 与 练习 题 4.14 ”假设 文件 foo.txt 和 bartxt 都 存在 ， 下 面 程序 的 输出 是 什么 ? 


{ int fdl, fd2, fd3:; 
fdl = open("foo.txt", O_ RDONLY. 0): 
fd2 = open("bar.txt". O_ RDONLY. 0): 
close(fd2); 
fd3 =open("foo.txt", O_ RDONLY. 0): 
Printf ("fd3 = %d\n", fd3); 
exit(0); 

} 


4.3.3 ”内 核 文件 VO 数据 结构 共享 原理 


Linux 系统 中 ， 由 于 每 次 调用 open 函数 都 会 创建 一 个 新 的 文件 对 象 和 一 个 新 的 描述 符 ， 但 同一 
文件 仅 有 一 个 v-node; 因此 ， 一 个 进程 对 一 个 文件 执行 多 次 open 函数 ， 比 如 执行 两 次 
f=open("f1",…)， 就 会 创建 两 个 文件 对 象 、 两 个 描述 符 和 一 个 v-node， 如 图 4-9 所 示 。 由 于 两 个 文 
件 对 象 指向 同一 v-node，v-node 引用 计数 变 成 2。 这 样 ， 当 调用 open 函数 去 打开 一 个 已 有 v-node 
节点 的 文件 时 ， 不 创建 新 的 v-node， 仅 将 文件 的 v-node 引用 计数 i_count 加 1。 不 难 获知 ， 当 我 们 
调用 close 函数 关闭 某 个 文件 时 , 如 果 v-node 引用 计数 大 于 1, 只 需要 将 计数 值 减 1, 仅 当 关闭 v-node 
的 i_count 成 员 为 1 的 文件 时 ， 才 销毁 其 v-node 对 象 。 

文件 对 象 (file 结构) 表 


描述 符 表 


个 站 得 -ac 老 v-node 表 
(每 个 进程 一 张 表 ) 站 nh 
9 引用 计数 :1 文件 f1 的 v-node 结 构 
2 Yoo 指针 绰 于 到 2 
fdl=3| _f Oo | 文件 长 度 
fd2=4 文件 fl 文件 权限 
打开 模式 数据 块 地 址 
读 写 位 置 : 
引用 计数 :1 
v-node 指 针 


图 4-9 文件 共享 ， 两 个 描述 符 通过 两 个 文件 表 表 项 共享 同一 磁盘 文件 


Linux 系统 中 ， 子 进程 可 以 继承 父 进程 所 有 已 经 打开 的 文件 。 假 设 父 进程 有 如 图 4-10 所 示 的 打 
开 文件 。 如 果 父 进程 创建 一 个 子 进程 ， 子 进程 会 获得 父 进程 描述 符 表 的 一 个 副本 。 由 于 父子 进程 共 
享 相同 的 打开 文件 表 , 在 文件 表 中 ,原来 由 父 进程 打开 的 每 个 文件 ， 都 会 有 两 个 文件 描述 符 指向 它 ， 
一 个 来 自 父 进程 ， 为 一 个 来 自 子 进程 ， 所 以 文件 表 中 的 引用 计数 变 成 了 2， 如 图 4-11 所 示 。 不 难 获 
知 ， 当 我 们 调用 close 函数 关闭 某 个 文件 时 ， 如 果 其 文件 对 象 的 引用 计数 大 于 1， 只 需要 将 计数 值 减 
1， 仅 当 关 闭 文件 对 象 引 用 计数 为 1 的 文件 时 ， 才 销毁 其 文件 对 象 。 
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Linux 编 程 


文件 对 象 表 v-node 表 
(所 有 进程 共享 ) (所 有 进程 共享 ) 
Ge 文件 A 文件 A 
i 了 JT 和 模式 避 用 计数: 
读 写 位 置 文件 长 度 
0 ss 引用 计数 :1 文件 权限 
2 CoS v-node 指 针 数据 块 地址 
fdl=3 : 
fd2=4 文件 B 文件 B 
ml 引用 到 1 
读 写 位 置 文件 长 度 
引用 计数 :1 文件 权限 
v-node 指 针 数据 块 地 二 


图 4-10 典型 的 内 核 文 件 IO 数据 结构 ， 两 个 描述 符 引用 不 同 的 文件 ， 没 有 共享 


人 二 本 文件 对 象 表 v-node 表 
站 (0 (所 有 进程 共享 ) 

] 文人 文件 A 
2 打开 模式 可 用 计数 :1 
fd1=3 读 写 位 置 文件 长 度 
fd2=4 引用 计数 :2 文件 权限 
v-node 指 针 数据 块 地 址 

子 描述 符 表 文件 B 文件 B 
9 打开 模式 引用 计数 :1 
| 读 写 位 置 文件 长 度 
a 引用 计数 :2 7 文件 权限 
fd2=4 v-node 指 针 数据 块 地 址 


图 4-11 子 进程 如 何 继承 父 进程 的 打开 文件 ， 初 始 状态 如 图 4-9 所 示 


4.3.4 dup 和 1/O 重 定向 


回顾 一 下 VO 重 定向 和 管道 的 概念 以 及 命令 键入 方法 ， 可 发 现 这 两 个 特性 给 我 们 带 来 极 大 的 灵 
活性 ， 其 实质 是 将 标准 输入 、 标 准 输出 描述 符 映射 到 不 同 的 文件 对 象 。 更 改 文件 描述 符 到 文件 对 象 
映射 关系 的 UNIX LO 系统 调用 函数 是 dup 函数 。 实 际 上 ，Linux 系统 提供 dup 函数 具有 非常 重大 的 
意义 : 其 一 ， 通 过 IO 重 定向 ， 可 使 一 个 应 用 程序 脱离 命令 窗口 (或 命令 终端 ) 运 行 ， 即 使 用 户 关闭 命 
令 窗 口 或 退出 登录 ， 程 序 也 不 用 退出 ， 实 现 系 统 服 务 或 守护 进程 ， 其 二 ， 由 于 网 络 连接 本 质 上 也 是 
文件 对 象 ，dup 函数 可 将 程序 的 标准 输入 、 标 准 输出 重 定向 到 网 络 连 接 ， 将 传统 的 应 用 程序 变 成 网 
络 服务 程序 ， 如 Web 服务 器 的 CGI 程序 就 是 这 样 实现 的 ， 第 8 章 将 要 介绍 的 weblet 也 是 这 样 实现 
的 。 下 面 介绍 dup 函数 的 使 用 方法 与 VO 重 定向 的 实现 ， 如 何 用 dup 函数 实现 管道 可 查看 第 7 章 。 


1. dup 函数 的 使 用 方法 


dup 函数 与 open 函数 有 些 类 似 ， 也 是 打开 一 个 新 的 文件 描述 符 。 不 同 的 是 ，dup 函数 是 将 一 个 
旧 文件 描述 符 复制 到 一 个 新 文件 描述 符 中 ， 使 这 两 个 文件 描述 符 指向 同一 文件 对 象 。dup 函数 的 声 
明 如 下 : 
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#include <unistd h> 
int dup(int oldfd); 
int dup2(int oldfd . int newfd); 


返回 值 ， 若 成 功 ， 返 回 非 负 的 描述 符 ， 否 则 返回 -1。 


dup 函数 有 两 种 形式 : dup 函数 总 是 取 文件 描述 符 的 最 小 可 用 值 作为 新 的 文件 描述 符 ， 若 成 功 ， 


返回 新 的 


文件 描述 符 , 否则 返回 - 1; dup2 函数 将 描述 符 oldfd 中 的 文件 对 象 指针 复制 到 描述 符 newfd 


中 ， 若 newfd 现在 已 经 打开 ， 则 先 关 闭 ， 再 执行 复制 操作 ， 若 成 功 ， 返 回 新 的 文件 描述 符 newfd， 


否则 返回 


复制 操作 。 


下 面 
在 该 图 中 


(a) 执行 fd=open("outfile",…) 后 


- 1。 如 果 oldfd 等 于 newfd， 则 dup2 函数 直接 返回 newfd， 而 不 用 先 关闭 newfd， 再 执行 
这 个 例子 (testdup.c) 演 示 了 dup 和 dup2 函数 的 用 法 , 可 结合 图 4-12 来 理解 程序 的 执行 过 程 。 
， 我 们 将 文件 对 象 和 v-node 对 象 合并 ， 并 写成 文件 名 。 


(b) 执行 f4_bak=dup() 后 
描述 符 表 。 ”文件 表 与 w-node 表 人 


(0) 执行 dupzlfd,1) 后 (d) 执行 close(fd) 后 
描述 符 表 文件 表 与 v-node 表 描述 符 表 文件 表 与 v-node 表 


(e) 执行 dup2(saved_fd,1) 后 (f) 执行 close(fa_bakj 后 
描述 符 表 文件 表 与 v-node 表 描述 符 表 文件 表 与 v-node 表 


图 4-12 ”函数 open/close/dup/dup2 执行 后 文件 描述 符 表 的 变化 情况 


访 testdup.c 源 代码 */ 


1 
2 
3 
4 
5 
6 
8 


#include "wrapper.h" 
int main(void) 
{ 


intfd, fd_bak: 

char info[] = "how test dup and dup2 work\n": 
fd-open("outfile", O_RDWRIO_CREAT. 0600): 
fd bak = dup(1): 

dup2(fd, 1): 
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9 close(fd): 

10 write(l, "This is a test", strlen(info)): 
11 dup2(fd_bak, 1); 

12 write(1, info, strlen(info)): 

13 close(fd bak); 

14 Tetum 0; 

es, 


图 4-12(a): 由 于 0、1、2 分 别 是 标准 输入 、 标 准 输 出 、 标 准 错误 输出 的 文件 描述 符 ， 其 指针 指 
向 相应 的 tty 设备 ， 因 此 调用 open 函数 ， 打 开 文 件 “outfile”， 返 回 描述 符 fd=3。 

图 4-12(b): 调用 dup(1)， 将 文件 描述 符 1 中 的 监视 器 (或 终端 窗口 tty) 文 件 对 象 指针 复制 到 最 小 
的 可 用 描述 符 4 的 指针 域 , 使 1 和 4 两 个 文件 描述 符 都 指向 终端 窗口 tty, 将 终端 窗口 的 文件 对 象 指 
针 备份 到 fd bak。 

图 4-12(c): 调用 dup2(fd,1)， 将 f4=3 中 保存 的 “outfile” 文 件 对 象 指针 复制 到 文件 描述 符 1， 接 
下 来 的 write 语句 输出 到 标准 输出 的 信息 被 写 入 文件 “outfile”， 程序 执行 后 ， 该 文件 的 内 容 为 “test 
dup and dup2”。 

图 4-12(d): 执行 close(fd)， 关 闭 文件 描述 符 3， 文 件 描述 符 3 变 为 空 。 

图 4-12(e): 执行 dup2(saved_fd,1), 从 弓 bak 恢复 终端 窗口 文件 对 象 指针 到 文件 描述 符 1, 这 样 ， 
其 后 执行 的 write 函数 , 会 将 信息 正常 写 入 终端 窗口 设备 , 因此 程序 执行 后 , 在 终端 窗口 中 显示 “how 
test dup and dup2 work” 。 

图 4-12(9: 执行 close(saved_fd)， 关 闭 文件 描述 符 5。 

下 面 编 译 和 执行 程序 : 

$8cc testdup.c -otestdup -L. -wrapper 

$ /estdup 

how test dup and dup2 work 


$ cat outfile 
Thisis a test 


比 > 思考 与 练习 题 4.15 假设 文件 atxt 和 b.txt 都 存在 ， 有 以 下 一 段 代码 : 
int fd1,fd2,fd3,fd4: 
fdl=open( “a.txt” ,0_RDONLY.0): 
fd2=open( “b.txt” ,0_WRONLY.0): 
fd3=dup(fd1): 
fd4=dup2(fd2.0): 
请 给 出 这 段 代码 执行 后 人 1、fd2、 和 3、f44 的 值 。 


2. 用 dup 实现 |/O 重 定向 


UNIX Shell 的 输入 重 定向 就 是 将 原来 从 键盘 设备 输入 数据 ， 改 为 从 指定 文件 读 取 ， 而 输出 重 定 
向 是 指 把 本 来 要 输出 到 监视 器 (或 终端 窗口 ) 的 信息 写 入 指定 文件 。 从 图 4-3 可 知 , 通过 将 文件 描述 符 
0 指向 指定 文件 的 file 结构 可 实现 输入 重 定向 , 将 文件 描述 符 1 指向 某 文件 的 fie 结构 可 实现 输出 重 
定向 。 这 些 特性 很 容易 使 用 dup 函数 来 实现 。 以 下 是 一 个 实例 。 

下 面 的 程序 dupl.c 按照 一 次 一 个 字符 的 方式 将 来 自 键盘 的 输入 显示 在 屏幕 上 , 请 在 指定 位 置 Q@) 
插入 适当 的 代码 ， 将 其 输出 重 定向 到 文件 dup2.out。 
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#include "wrapper h" 
int main() 
‘ 
char c; 
@ 
while ((c=getchar0)!=EOF) 
Pputchar(c): 
} 
修改 后 的 程序 dup2.e 如 下 : 
#include “wrapper.h" 
2 intmain0 
和 
4 charc:; 
5 It 
6 忆 777): 
close(1): 
8 up(fd): 
号 while ((c=getchar0)!=EOF) 
10 putchar(e); 


TD 


总 共 插入 4 行 代码 ， 第 5 行 定义 新 的 文件 描述 符 伺 ， 第 6 行 以 只 写 方式 打开 文件 “dup2.out” 
用 于 保存 程序 输出 ,标志 O_CREAT 表示 若 文件 不 存在 ， 则 创建 该 文件 ; 第 7 行 关闭 文件 描述 符 1， 
使 之 变 为 可 用 ; 第 8 行将 文件 描述 符 和 中 的 文件 指针 复制 到 最 小 的 可 用 文件 描述 符 1 中 , 现在 标准 
输出 stdout 就 关联 到 文件 dup2.out 了 。 第 10 行 的 putchar(c) 会 将 输出 写 入 文件 dup2.out。 

现在 编译 和 执行 程序 : 

$ gecec -0 dup2 dup2.c -L. -wrapper 

$ Mup2 

Hello world 
<CTRL-D> 


$ more dup2.0ut 
Hello World 


注意 Ctltd 键 用 于 结束 输入 ， 它 使 getchar0 产 生 返 回 值 EOF。 
弛 ”思考 与 练习 题 4.16 ”以 下 程序 将 来 自 键盘 的 输入 显示 在 屏幕 上 ， 在 位 置 @ 处 加 入 适当 的 代 
码 ， 将 标准 输入 重 定向 到 程序 源 文件 dup2.c。 


#include <stdio.h> 
#include <unistd h> 
#include <fentl.h> 
intmain0 
char c: 
@ 
while ((c=getcharO)!=EOF) 
putchar(c): 
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区 网 用 RIO 包 增 强 UNIX 1O 功能 


使 用 UNIX VO 进行 IO 编程 在 实际 应 用 中 存在 两 个 问题 : 一 是 在 某 些 情况 下 ，read 和 write 函 
数 实际 传送 的 字 节 数 少 于 实际 要 求 的 字 节 数 ， 这 种 情况 下 返回 的 值 叫 作 不 足 值 ， 不 足 值 有 时 给 编程 
控制 带 来 麻烦 ; 二 是 UNIX IO 系统 调用 函数 中 不 提供 从 某 个 文件 描述 逐 行 读 出 数据 的 函数 ， 而 实 
际 应 用 中 经 常 需要 这 样 做 。W. Richard Stevens 设计 的 RIO(Robust IO， 健 壮 VO) 包 较 好 地 解决 了 这 
两 个 问题 ， 为 开发 网 络 通信 应 用 程序 ， 提 供 了 方便 、 健 壮 和 高 效 的 IO 函数 库 。RIO 提供 两 类 不 同 
的 函数 : 

e 无 缓冲 的 输入 输出 函数 。 这 些 函 数 直接 在 存储 器 和 文件 之 间 传 送 数据 ， 没 有 应 用 级 缓冲 。 

调用 这 类 函数 可 方便 地 将 二 进 制 数据 读 写 到 网 络 和 从 网 络 读 出 二 进 制 数据 。 

e 带 缓冲 的 输入 函数 。 这 类 函数 可 高 效 地 读 取 文 本 行 和 二 进 制 数 据 ， 读 出 的 内 容 缓存 在 应 用 

级 缓冲 区 ， 类似 于 为 像 printf 这 样 的 标准 IO 函数 提供 的 缓冲 区 。 带 缓冲 的 RIO 输入 函数 是 
线程 安全 的 ， 可 被 多 个 线程 并 发 调用 。 


*4.4.1 ”RIO 的 无 缓冲 的 输入 输出 函数 
通过 调用 rio_readn 和 rio_writen 函数 ， 应 用 程序 可 以 在 存储 器 和 文件 之 间 直 接 传送 数据 。 


#include "wrapperh" 
ssize_t rio_readn(int fd , void *usrbuf , size_t n): 


返回 值 : 若 成 功 ， 返 回 读 出 的 字 节 数 ， 若 遇 到 EOF， 返 回 0， 若 出 错 ， 返 回 -1。 


ssize trio_writen(int fd , void *usrbuf , size_t n); 


返回 : 若 成 功 ， 返 回 传送 的 字 节 数 ， 若 出 错 ， 返 回 -1。 
rio_readn 函数 从 描述 符 得 的 当前 文件 位 置 最 多 传送 n 个 字 节 到 缓冲 区 usrbuf。rio_writen 函数 
从 缓冲 区 usrbuf 传送 n 个 字 节 到 描述 符 他 。rio_readn 函数 在 遇 到 EOF 时 只 能 返回 一 个 不 足 值 。 
rio_writen 函数 决 不 会 返回 不 足 值 。 对 同一 个 描述 符 ， 可 以 任意 交错 地 调用 rio_readn 和 rio_writen 
函数 。 
下 面 给 出 rio_readn 和 rio_writen 函数 的 代码 实现 。rio_readn 函数 反复 调用 read 函数 ， 直 到 获得 
指定 数量 的 字 节 ， 或 read 函数 出 错 ， 或 遇 到 文件 结束 标志 。rio_writen 函数 反复 调用 write 函数 ， 直 
到 指定 数量 的 字 节 被 写 入 , 或 write 函数 出 错 。 这 两 个 函数 还 有 一 个 好 处 : 如 果 rio_readn 和 rio_writen 
函数 被 信号 处 理 中 断 而 返回 (参考 第 5 章 ), 就 会 手动 重启 read 或 write 函数 , 因而 具有 较 好 的 鲁 棒 性 。 


上 # 函数 tio_readn 和 tio_writen 的 源 代 码 ， 位 于 文件 wrapperc 中 间 
1 ssize trio readn(intfd.,void *usrbuf size tn) 

2 { 

3 size tnleft=n: 

4 ssize_t nread:; 

5 char *bufp =usrbuf: 

6 

gh while (nleft > 0) { 

8 if((nread =read(fd. bufp. nlefl)) <0) { 

9 让 (emmo 一 EINTR) ”上 庆 被 信号 处 理 中 断 */ 
10 mread=0: 上 # 重新 调用 read0 */ 
11 else 
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12 Tetum -1: 启 ermo 中 为 其 他 错误 标志 */ 
13 

14 elsef (nread — 0) 

15 break: nEOF* 

16 nleft = nread: 

17 bufp += nread: 

18 } 

19 Tetum (n - nleft): 遍 retum >=0*/ 

20° 

21 ssize trio writen(intfd, void *usrbuf size tn) 

2 

23 size tnleft=n; 

24 ssize_t nwritten: 

25 char *bufp = usrbuf: 

26 

2 while (nleft > 0) { 

28 下 (written = write(fd, bufh, nleft)) <= 0) { 

29 这 (ermo 一 EINTR) ”/* 被 信号 处 理 中 断 */ 
30 mwritten 一 0: 上 # 重新 调用 writeO */ 
31 else 

32 Tetum -1; 店 ermo 中 为 其 他 错误 标志 */ 
33 } 

34 nleft -= nwritten: 

< bufp += nwnitten: 

36 } 

3 Tetum n: 

38 _} 


*4.4.2 ”RIO 带 缓冲 的 输入 函数 


一 个 文本 行 就 是 一 个 以 换行 符 结尾 的 ASCII 码 字符 序列 。 在 UNIX 系统 中 , 换行 符 (\n') 与 ASCI 
码 换行 符 LF) 相 同 ， 值 为 0x0a。 使 用 read 函数 计算 文本 行 数量 ， 或 逐 行 读 出 文本 行 ， 都 必须 自己 编 
程 实现 。 一 种 统计 文本 行 数量 的 方法 是 用 read 函数 一 次 一 个 字 节 地 从 文件 传送 到 用 户 存储 器 ， 检 查 
每 个 字 节 来 查找 换行 符 。 该 方法 运行 效率 低 ， 因 为 每 读 取 文件 中 的 一 个 字 节 ， 都 要 执行 一 次 read 函 
数 调用 。RIO 包 的 包装 函数 rio_readlineb 较 好 地 解决 了 这 个 问题 ， 它 每 次 从 一 个 内 部 读 缓冲 区 拷贝 
一 个 文本 行 ， 当 缓冲 区 变 空 时 ， 会 自动 地 调用 read 函数 以 重新 填 满 缓冲 区 。 

对 于 既 包 含 文 本 行 也 包含 二 进 制 数 据 的 文件 ，RIO 包 还 提供 了 rio_readn 的 带 缓冲 区 版 本 ， 名 为 
rio_readnb， 它 也 直接 从 RIO 包 的 内 部 读 缓冲 区 中 传送 原始 字 节 。 

RIO 带 缓冲 的 主要 函数 有 rio_readinitb、rio_readlineb、rio_readnb 三 个 。 


x 


#include "wrapper.h" 
Void rio_readinitb(rio_t *1p , int fd): 
返回 值 : 无 
ssize_t rio_readlineb(rio t *1p , void *usrbuf , size_t maxlen): 
ssize_trio readnb(rio_t *1p .void *usrbuf size_tn): 
返回 值 : 若 成 功 ， 返 回 读 的 字 节 数 ; 若 到 达 EOF， 返 回 0; 若 出 错 ， 返 回 -1。 


rio_readinitb 函数 用 于 初始 化 读 缓冲 区 和 rio t 文 件 , 它 将 描述 符 得 和 地 址 tp 处 的 一 个 类 型 为 fio t 
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的 读 缓冲 区 联系 起 来 。 

rio_readinitb 函数 从 文件 二 读 出 一 个 文本 行 (包括 结尾 的 换行 符 ), 将 它 拷贝 到 存储 器 位 置 usrbuf， 
并 且 用 空 字 符 \0' 来 结束 行 。ro_readlineb 函数 最 多 读 maxlen -1 个 字 节 ， 余 下 的 一 个 字符 留 给 结尾 的 
空 字符 。 超 过 maxlen -1 字 节 的 文本 行 被 截断 ， 并 用 一 个 空 字符 结束 。 

Tio_readnb 函数 从 文件 二 最 多 读 n 个 字 节 到 存储 器 位 置 usftbuf。 对 同一 描述 符 ， 对 rio_readlineb 
和 rio_readnb 的 调用 可 以 交叉 执行 。 当 然 ， 带 缓冲 和 无 缓冲 的 fio_readn 函数 是 不 能 交叉 执行 的 。 

下 面 给 出 一 个 RIO 函数 使 用 示例 。cpfile.c 展示 了 如 何 使 用 RIO 函数 一 次 一 行 地 从 标准 输入 拷 
贝 一 个 文本 文件 到 标准 输出 。 


上 #cpfilec 源 代码 */ 
1 #include "wrapper.h" 


2 

3 int main(int argc, char **argv) 

4 4 

5 intn; 

6 Tio_trio; 

7 char buf[ MAXLINE]: 

8 

9 rio_readinitb(&rio, STDIN_FILENO): 

10 while((n = rio_readlineb(&rio, buf, MAXLINE)) (=0) 
Eh Tio_writen(STDOUT FILENO,buf n); 
wD 


现在 分 析 RIO 包 中 几 个 重要 函数 的 源 代码 。 先 看 rio 读 缓冲 区 的 格式 和 初始 化 函数 nio_readinitb 
的 源 代码 ， 后 者 将 一 个 打开 的 文件 描述 符 和 缓冲 区 关联 。 


族 Tio 读 缓冲 区 的 格式 定义 ， 位 于 文件 wrapper.h */ 


1 typedefstruct { 

区 intrio 位: 上 # 从 rio 他 读 取 数 据 到 内 部 缓冲 区 buf */ 
3 int rio_ent: 上 # 内 部 buf 中 未 读 字 节 数 */ 

4 char *rio_bufptr: 上 # 内 部 buf 中 下 一 个 未 读 字 节 天 

5 charrio_ buf[RIO_BUFSIZE]: /* 内 部 缓冲 区 */ 

6 }riot; 


上 #rio 缓冲 区 中 初始 化 函数 rio_readinitb 的 源 代码 ， 位 于 文件 wrapper.c */ 


1 void rio_readinitb(rio_t *p, int fd) 
| 

3 p>rio fd=fd: 

4 Jp->Tio_cnt=0: 

| 1p->rio_bufptr = p->rio_buf: 


RIO 包 的 核心 是 rio_read 函数 ， 可 看 成 UNIX read 函数 的 一 个 带 缓冲 版 本 。 当 调用 rio read 要 
求 读 n 个 字 节 时 ， 如 果 缓 冲 区 为 空 ， 就 会 通过 调用 一 次 read 函数 调用 填 满 读 缓冲 区 ;如 果 读 缓冲 区 
内 还 有 tp->rio_cnt 个 未 读 字 节 ， 就 直接 将 缓冲 区 中 的 数据 复制 给 用 户 缓冲 区 。rio_read 函数 的 实现 
代码 如 下 : 


上 #Tio_read 函数 的 实现 代码 ， 位 于 文件 wrapperc */ 
1 staticssize t rio read(rio tsmp,char *usrbuf. size tn) 
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2 

3 int nt: 

4 

5 while (p->rio cnt <—=0) { 庆 如 果 缓冲 区 是 空 的 ， 重 填 所 
6 hp->rio cnt=read(rp>rio fd,rp->rio buf 

sizeof(rp >rio_buf)); 

8 if(p->rio cnt<O0) { 

9 让 (ermo !=EINTR) ”/* 被 信号 处 理 中 断 */ 

10 Teturn -1; 


11 } 
i elseif(p->rio cnt—0) /EOF*/ 


13 Tetum 0; 

14 else 

15 Ip->Tio_bufptr=Ip->rio buf /* 重 置 buffer 指针 */ 
16 ’ 

gt 

18 让 从 内 部 缓冲 区 将 min(n, mp->rio_cnb 个 字 节 复制 到 用 户 缓冲 区 */ 
Eh cnt=n; 

20 if(rp->rio cnt<n) 

21 cnt=1p->rio_cnt; 

2 memcpy(usrbuf, mp->rio_bufptr, cnt); 

23 Pp->rio_bufptr += cnt; 

24 P->rio_cnt = cnt: 

25 Tetum cnt: 

26 } 


于 应 用 程序 ,rio_read 函数 和 UNIX read 函数 的 语义 是 相同 的 read 函数 在 出 错时 返回 值 为 -1， 

设置 错误 标记 ermo, 而 遇 到 EOF 时 返回 0。 如 果 要 求 的 字 节 数 超出 读 缓冲 区 内 未 读 字 节 的 数量 , 它 
会 返回 一 个 不 足 值 。 不 同 之 处 是 ，rio_read 函数 解决 了 信号 唤醒 问题 ， 在 很 多 场景 下 ， 用 rio_read 蔡 
换 read 函数 ， 可 使 程序 具有 更 好 的 鲁 棒 性 。 

以 下 是 rio_readlineb 和 rio_readnb 函数 的 源 代码 ，rio_readlineb 反复 调用 rio read， 每 次 调用 仅 
从 读 缓冲 区 返回 一 个 字 节 ， 检 查 这 个 字 节 是 否 是 行 尾 换行 符 。 由 于 rio_read 不 必 陷 入 内 核 ， 其 执行 
效率 比 read 函数 高 得 多 ， 因 此 调用 rio_readlineb 函数 可 以 高 效 地 读 到 文本 行 。rio_readnb 函数 和 前 
面 的 fio_readn 也 有 相似 的 结构 ， 不 同 的 是 ，rio_readnb 每 次 调用 rio_read 来 读 缓冲 区 以 获取 数据 ， 
而 rio_readn 调用 read 以 从 文件 获取 数据 。 


旋 Tio_readlineb 函数 的 源 代码 ， 位 于 文件 wrapper.c */ 
ssize_t rio_readlineb(rio t*#mp, void *usrbuf size t maxlen) 
{ 

intn, re: 

char c. *bufp = usrbuf: 


for (n=1:n<maxlen: nt+) { 
让 (Gec =rio read(ip., &c. 1))— 1){ 
*bufp++ =¢; 
if(c—="\n) 
10 break: 
11 }elseif(rc—0){ 
12 f= 1) 


1 
2 
3 
4 
5 
6 
7 
8 
9 
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13 Tetum 0; /* EOF， 未 读 到 数据 */ 
14 else 

15 break; 。” 片 EOF, 读 到 一 些 数据 */ 
16 }else 

17 Tetum -1; 上 # 出 错 所 

18 } 

19 *bufp =0; 

20 Tetum n; 

ED 


/#Tio readnb 函数 的 源 代 码 ， 位 于 文件 wrapper.c */ 


| ssize_t rio_readnb(rio_t *1p, void *usrbuf size tn) 
P| 

= size tnleft =n; 

4 ssize t nread: 

5 char *bufp = usrbuf: 

6 

7 while (nleft > 0) { 

8 if ((nread =rio_read(1p, bufp, nlefi)) < 0) { 

9 站 (enmo 一 EINTR)/* 被 信号 处 理 中 断 */ 
10 nread=0; 。”/* 重新 调用 read 函数 */ 
3 else 

12 Tetum -1; 上 # 其 他 错误 标志 */ 

13 } 

14 elseif (nread — 0) 

15 break: EOF */ 

16 nleft = nread; 

17 bufp += nread; 

18 } 

19 Tetum (n - nleft): 让 retum >=0*/ 


>On 
多 * 思 考 与 练习 题 4.17 编写 程序 ， 用 RIO 包 中 的 函数 实现 文件 复制 功能 。 


EE 如 文件 组 织 


前 面 介绍 了 操作 系统 的 文件 系统 模块 从 外 存 获得 文件 属性 信息 后 ， 如 何 执行 open、close、read、 


write、lseek 等 文件 操作 。 在 这 里 ， 我 们 讨论 如 何在 存储 设备 上 管理 文件 属性 和 文件 内 容 。 


4.5.1 文件 属性 、 目 录 项 与 目录 


对 使 用 者 来 说 ， 文 件 成 为 计算 机 系统 、 数 码 设备 管理 数据 信息 的 标准 方法 ， 系 统 中 所 有 可 存 取 
的 资料 ， 都 以 文件 形式 存放 在 各 目录 下 。 文件 为 使 用 者 提供 了 操作 数据 资料 的 统一 方法 、 统 一 界面 ， 


使 用 者 无 须 了 解 存储 设备 种 类 、 特 性 及 文件 保存 格式 ， 使 文件 操作 变 得 简单 。 计 算 机 系统 的 了 


[ 作 与 


功能 是 通过 多 进程 并 发 来 实现 的 ， 文 件 内 容 是 进程 的 “原材料 ”与 “输出 品 ”。 文 件 系统 使 用 目录 


对 大 量 文件 资料 进行 分 类 、 分 层 管理 ， 方 便 使 用 者 检索 、 搜 寻 、 操 作 所 需 文 件 档案 。 
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1. 文件 属性 和 文件 目录 的 概念 


文件 建立 时 ， 文 件 系统 自动 记录 创建 时 间 、 创 建 者 、 文 件 大 小 等 属性 ， 这 些 属性 不 仅 可 供 文件 
使 用 者 使 用 ， 也 是 文件 系统 管理 、 维 护 文件 的 依据 。 常 见 的 文件 属性 可 达 十 多 种 ， 可 分 为 三 类 。 

e 文件 一 般 属 性 : 包括 文件 名 、 创 建 者 、 拥 有 者 、 文 件 大 小 、 创 建 时 间 、 最 后 修改 时 间 、 上 

次 存 取 时 间 等 。 

e 数据 位 置 属性 ， 存储 文件 内 容 的 磁盘 块 号 。 

。 文件 安全 属性 :包括 文件 存 取 权 限 (用 户 、 用 户 组 是 否 可 读 、 可 写 、 可 执行 、 可 删除 )、 文 件 

保护 密码 等 。 

文件 属性 保存 在 称 为 目录 项 (又 称 文件 控制 块 ，File Control Block，FCB) 的 结构 中 ， 具 有 相同 
路 径 文件 的 目录 项 构成 文件 目录 (Linux 系统 下 称 为 目录 文件 )。 用 户 、 应 用 程序 利用 文件 目录 获得 文 
件 属性 ， 实 现 对 文件 内 容 的 存 取 ， 一 般 通过 文件 名 来 读 写 文件 。 

图 4-13 显示 了 文件 属性 、 目 录 和 数据 内 容 间 的 关系 。 假 设 在 一 个 多 级 目录 环境 下 有 一 个 文件 
/etc/passwd。 首 先 ， 根 目录 /是 目录 文件 ， 其 内 容 是 图 4-13 中 上 方 的 目录 表 ， 其 中 每 个 文件 或 子 目录 
的 目录 项 在 目录 表 中 占 一 行 ， 至 少 包含 文件 名 、 文 件 大 小 、 盘 块 号 三 个 属性 ， 其 中 盘 块 号 是 文件 或 
子 目 录 数 据 内 容 所 在 盘 块 号 。 在 图 4-13 中 ， 子 目录 etc 的 大 小 为 384 字 节 ， 所 在 盘 块 号 为 7。 所 以 
磁盘 块 7 中 的 数据 内 容 是 /ete 的 目录 表 ( 图 4-13 中 间 表 格 所 示 )， 其 中 包含 passwd 文件 的 目录 项 ， 
passwd 文件 的 大 小 为 440 字 节 ， 其 数据 所 在 盘 块 号 为 192。 因 此 ,磁盘 块 192 中 就 是 passwd 文件 内 
容 ， 即 系统 用 户 数据 库 。 


/ 
PD boot 文件 名 大 小 ( 字 节 ) 盘 快 号 二 
PD bn boot ”1280 110,200,601 IN 
PD sbin home 256 310 目录 文件 /etc 的 目录 项 ( 文 
Ge。 人 
Co guest i 
ED ean 文件 属性 名 全 
OD usr 
Ee wr < 文件 名 大 小 字 匠 可 人 快 村 和 > 、 
re 5 2.75 文件 目录 
Ee te passwd 440 192 | (目录 文件 /etc 的 内 
己 rc fstab 354 910 容 ) 
passwd 


DD fstab 


/etc/passwd: 


TOOt:X:0:0:Superuser:/: 
daemon:x:1:1:Systemdaemons:/ete: 


图 4-13 文件 属性 、 目录 和 数据 内 容 间 关 系 示例 
$e 思考 与 练习 题 4.18 若 已 知 根 目录 所 在 盘 块 号 为 1, 简 述 如 何 读 入 文件 /etc/passwd 的 第 1 行 。 
4.5.2 ”逻辑 地 址 与 物理 地 址 


通常 ， 文 件 内 容 在 磁盘 中 是 以 磁盘 块 为 单位 存放 的 ， 一 个 磁盘 块 只 能 分 配给 一 个 文件 使 用 。 磁 
盘 空间 分 配 的 基本 单位 是 磁盘 块 ， 一 个 磁盘 块 就 是 一 个 扇 区 ， 大 小 通常 为 512B~4KB。 磁 盘 是 块 设 
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备 ， 磁 盘 输 入 输出 以 磁盘 块 为 单位 ， 磁 盘 以 盘 块 为 单位 进行 编 址 ， 数 据 在 磁盘 上 的 实际 地 址 是 指 盘 
块 号 。 

当 我 们 讨论 数据 在 文件 中 的 位 置 时 ， 通 常 以 文件 起 始 位 置 为 参照 ， 所 以 称 为 文件 逻辑 位 置 或 逻 
辑 地 址 ， 一 般 指 文件 中 的 某 个 字 节 、 记 录 、 数 据 块 在 文件 中 的 编号 。 一 个 数据 块 存放 在 一 个 磁盘 块 
中 ， 数 据 块 在 文件 中 的 编号 又 称 为 相对 块 号 (或 逻辑 块 号 )， 或 称 逻 辑 地 址 。 所 在 的 盘 块 号 通常 称 为 
物理 地 址 ， 也 称 实际 地 址 。 

图 4-14 解释 了 文件 逻辑 地 址 与 物理 地 址 的 概念 。 假 设 某 文 件 由 8n 个 文本 行 构成 ， 行 号 分 别 为 
0、1、2、...、8n - 1。 假 设 每 行 长 度 为 64 个 字符 ， 则 文件 大 小 为 512n 个 字 节 。 每 个 字 节 有 字 节 号 ， 
是 每 个 字 节 到 文件 起 始 位 置 的 字 节 距离 ， 第 一 行 ( 行 号 为 0) 的 倒数 第 二 个 字 节 的 字 节 号 为 62， 它 是 
调用 read/write 函数 读 写 该 字 节 时 的 文件 指针 值 。 假 设 磁盘 块 大 小 为 512 字 节 ， 可 将 文件 内 容 按 512 
字 节 划分 为 n 个 数据 块 ， 数 据 块 编号 0、1、...、n - 1 就 是 逻辑 地 址 (或 相对 块 号 、 逻 辑 块 号 )。 每 个 
数据 块 的 内 容 存 放 在 一 个 单独 的 磁盘 块 中 ， 盘 块 号 称 为 物理 地 址 (或 磁盘 块 号 )， 分 配给 一 个 文件 的 
磁盘 块 的 地 址 可 以 不 连续 。 进 行文 件 读 写 时 , 需要 根据 相对 块 号 (逻辑 地 址 ) 计 算 磁盘 块 号 (物理 地 址 )， 
至 于 如 何 从 逻辑 地 址 映射 物理 地 址 ， 稍 后 进行 讨论 。 
行 号 ， 假 设 某 文件 由 8m 
个 文本 行 构成 ， 行 号 分 
别 为 0、1、2、...、8n- 


字 节 号 ， 每 行 有 64 个 字符 ， 则 文件 
大 小 为 512n 个 字 节 ， 每 个 字 节 有 字 
节 号 ， 若 字 节 号 从 0 开始 计数 ， 则 图 


罗 辑 地 址 : 若 将 文件 内 容 
按 512 字 节 划 分 为 很 多 数据 
块 ， 则 相对 块 号 〈 逻 辑 地 


址 ) 依次 为 0、1、...、n-1 1 中 红色 字符 “a” 的 字 节 号 为 62 
CE i 富 六 号 ;8 4 文物 理 地 址 《磁盘 志 号 ,得志 
_ 件 读 写 指针 值 ) 号) ;每 个 数据 决 的 内 容 
aaaaaaaaaaai aaa 可 存放 到 一 个 单独 的 磁盘 


bbbbbbbbbbbb……… bbb 块 中 


hhhhhhhhhhhh…… hhh 


aaaaaaaaaaaa …… aaa 
bbbbbbbbbbbb…… bbb 


aaaaaaaaaaaa …… aaa 
bbbbbbbbbbbb……bbb 


hhhhhhhhhhhh****** hhh 


每 行 64 个 字符 
图 4-14 文件 逻辑 地 址 与 物理 地 址 关系 示例 


彩 ” 思考 与 练习 题 4.19 假设 磁盘 块 的 大 小 为 512 字 节 , 已 知 某 字 节 的 读 写 指针 值 为 pos, 计算 
其 所 在 数据 块 的 逻辑 块 号 。 


4.5.3 ”创建 和 读 写 文件 
分 析 文 件 结构 后 ， 就 可 以 讨论 文件 创建 和 文件 读 写 的 实现 原理 了 。 
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1. 创建 文件 


每 个 文件 都 有 目录 项 和 数据 内 容 ， 创 建 一 个 文件 后 ， 就 应 在 其 父 目 录 下 增加 一 个 目录 项 ， 在 其 
中 填 入 文件 属性 ， 同 时 根据 文件 大 小 为 其 分 配 磁盘 块 ， 同 时 将 盘 块 号 填 入 文件 目录 项 。 图 4-15 给 出 
了 创建 文件 名 前 后 文件 目录 结构 和 目录 表 的 变化 。 

用 户 程序 调用 文件 创建 系统 调用 (create 或 open) 创 建文 件 home/can/f3 的 过 程 如 下 : 

Q@ 根据 名 文件 的 大 小 为 其 分 配 磁盘 块 ， 如 15。 

@ 在 /home/can 目录 下 为 文件 名 增加 一 个 目录 项 ， 填 入 名 文件 的 属性 ， 包 括 盘 块 号 。 


/ ED boot 
Eo boot OD bn 
on OD sbin 
Eo win On home 
LD home 人 

guest can 
can En 

py [有 E 2 

水 Ee 口 B 

| 4 

文件 名 大 小 ( 字 节 ) ” 盘 快 号 … 文件 名 大 小 ( 字 节 ) 慢 快 号 … 

11 311 75 f1 311 75 

全 640 2.7 f2 640 27 

1 f3 15 


图 4-15 “创建 文件 名 前 后 文件 目录 结构 与 目录 表 的 变化 情况 示例 
胸 ” 思考 与 练习 题 4.20 请 给 出 删除 文件 亿 的 过 程 。 
2. 文件 读 写 操作 


由 于 磁盘 文件 内 容 的 读 写 以 磁盘 为 单位 进行 ， 即 使 我 们 只 需要 读 写 一 个 字 节 ， 每 次 也 至 少 要 读 
个 盘 块 。 这 样 我们 在 执行 read(fd, buf len) 调 用 以 读 文 件 内 容 时 ， 过 程 应 该 是 : 
@ 首先 ， 根 据 读 写 指针 值 pos 和 读 写 长 度 len， 计 算 相关 的 逻辑 块 号 ; 
@ 将 所 有 相关 的 数据 块 读 到 内 存 ; 
@ 从 数据 块 中 选择 需要 的 数据 复制 到 缓冲 区 buf 中 。 
而 执行 write(fd, buf len) 调 用 以 写 文件 的 过 程 则 更 加 复杂 一 点 : 
@ 首先 ， 根 据 读 写 指针 值 pos 和 读 写 长 度 len， 计 算 相关 数据 块 的 逻辑 块 号 ; 
@ 若 第 一 个 或 最 后 一 个 数据 块 的 内 容 并 非 全 部 写 入 的 话 ， 要 先 将 其 读 入 内 存 ; 
@ 用 buf 中 的 数据 更 新 首 末 数据 块 相 关 字 节 ， 其 他 数据 块 内 容 直 接 取 自 buf; 
@ 将 各 数据 块 写 入 磁盘 。 
旨 ” 思考 与 练习 题 4.21 假设 磁盘 块 大 小 为 512B，/home/can 目录 的 内 容 如 图 4-16 所 示 。 应 用 程 
序 执行 fa=open("home/can/f2", O RDWR. 0)， 打 开 文 件 包 , 文件 亿 各 数据 块 所 在 的 盘 块 号 已 
经 读 入 内 存 ， 请 问 : 

(1) 执行 两 个 操作 :“lseek(fd.1000,.SEEK SET): read(fdbuf500):”， 请 问 需要 读 盘 几 次 ， 将 
哪些 磁盘 块 读 到 了 内 存 中 ? 

(2) 再 执行 两 个 操作 : “lseek(fd,2000,SEEK_SET):write(fd,buf,500):”, 请 问 需要 执行 几 次 读 
盘 和 写 盘 操作 ， 将 哪些 磁盘 块 读 到 了 内 存 中 ?哪些 磁盘 块 的 内 容 被 更 新 了 ? 


烟 
| 
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/home/can 目录 
文件 名 ”大 小 ( 字 节 ) 盘 快 号 
fi 311 75 
人 2 3000 2.7,11,25,87,6 
13 2 15 


图 4-16 /home/can 目录 的 内 容 


4.5.4 ”一体 化 文件 目录 和 分 解 目录 


1. 文件 目录 项 的 获取 方法 


由 于 文件 目录 、 文 件数 据 都 在 磁盘 上 ， 为 了 从 文件 中 读 写 一 些 数据 ， 必 须 先 将 文件 目录 读 入 内 
存 ， 从 中 找到 指定 文件 的 目录 项 ， 获 取 文件 数据 所 在 盘 块 号 (或 物理 地 址 )。 无 论 读 写 文件 目录 还 是 
文件 内 容 ， 都 以 磁盘 块 为 单位 进行 数据 传输 。 

一 些 系统 采用 一 体 化 文件 目录 ,也 就 是 所 有 文件 属性 都 保存 在 一 个 目录 项 中 。 图 4-17 是 讨论 一 
体 化 文件 目录 读 入 性 能 的 示例 。 在 这 里 ， 假 设 磁盘 块 大 小 为 512 字 节 ， 每 个 目录 项 占 48 字 节 ， 已 知 
/home/can 目录 文件 所 在 盘 块 号 ， 其 中 包含 1000 个 文件 属性 行 。 计 算 该 目录 文件 占用 的 盘 块 数 ， 并 
检索 信 文件 数据 所 在 盘 块 号 ， 这 总 共 需 要 耗 用 多 长 时 间 。 


达 
boot 


bin 
sbin 


home 文件 名 大 小 ( 字 节 )” 盘 块 号 … 
2 guest fl 311 75 
can 他 640 二 
| fl 本 
E 之 f4 2 5 
[i fB 
图 4-17 文件 目录 读 入 性 能 分 析 示 例 
首先 ， 计 算 /home/can 目录 占用 的 盘 块 数 比较 简单 ， 为 (1000*48)/512=93.7 个 磁盘 块 。 由 于 文件 
目录 并 未 按 文件 名 排序 ， 查 找 人 鼠 目录 项 需要 采用 顺序 搜索 方法 。 若 苹 目录 项 在 第 1 个 盘 块 (前 512 
字 节 内 )， 为 最 少 读 盘 次 数 ， 即 1 次 ; 若 目录 项 在 第 94 个 盘 块 ， 为 最 多 读 盘 次 数 ， 即 94 次 , 平 
均 读 盘 (1+94)/2=47.5 次 。 
我 们 来 分 析 文 件 目录 项 读 入 性 能 : 磁盘 涉及 磁盘 转动 ， 所 需 读 写 时 间 往 往 较 长 ， 达 ms 级 。 假 
定 每 次 读 盘 时 间 ( 包 括 磁盘 启动 ) 需 要 Sms， 读 取 47 个 盘 块 需要 耗 时 235ms， 这 个 时 间 不 可 小 冕 ， 目 
录 越 大 ， 所 需 时 间 越 长 ， 文 件 目录 获取 时 间 会 给 系统 性 能 带 来 较 大 影响 ， 应 采取 措施 优化 文件 目录 
获取 时 间 。 


2. 文件 目录 管理 改进 方法 : 目录 分 解 方案 


文件 目录 检索 时 间 长 的 重要 原因 之 一 是 目录 项 内 容 太 多 ， 减 少 检索 时 间 的 一 种 思想 是 减少 目录 
中 的 数据 量 ， 方 法 是 将 目录 项 分 解 为 符号 目录 项 与 基本 目录 项 ， 称 为 分 解 式 目录 。 其 中 : 


/home/can: 


WY 
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e 符号 目录 项 仅 包含 文件 名 与 用 于 定位 基本 目录 项 的 内 部 文件 号 (索引 号 )。 

e 一 个 磁盘 分 区 的 所 有 基本 目录 项 作为 一 个 列表 统一 存放 在 磁盘 固定 区 域 。 

图 4-18 是 将 文件 划分 为 符号 目录 项 和 基本 目录 项 的 示意 图 。 现在 我 们 来 分 析 目 录 管理 改进 后 的 
目录 项 读 入 性 能 。 采 用 目录 分 解 方案 后 ， 假 设 文件 内 部 号 占 2 字 节 ， 文 件 名 长 度 为 6 字 节 ， 分 解 前 
大 小 为 48 字 节 的 目录 项 ， 分 解 后 符号 文件 目录 中 占 8 字 节 ,基本 目录 项 长 度 为 42 字 节 。 

/home/can 目 录 表 (符号 目录 ): 


文件 名 文件 内 部 避 分 区 基本 目录 家: __ 
7 YE 吉本 
人 1234 

总 1 

人 4 100 CE 

> 1002 5 


4-18 文件 目录 读 入 性 能 分 析 示 例 


现在 我 们 来 分 析 分 解 式 目录 的 访问 性 能 。 首先 计算 文件 亿 的 基本 目录 项 所 在 盘 块 号 。 假设 文件 
全 的 内 部 文件 号 为 100， 分 区 基本 目录 表 的 起 始 位 置 盘 块 号 为 10000， 则 文件 锯 的 基本 目录 项 离 分 
区 基本 目录 表 中 起 始 位 置 的 字 节 距离 为 d=42*100=4200, 其 所 在 盘 块 与 第 一 个 盘 块 的 距离 (以 盘 块 为 
单位 ) 为 4200/512=8.2， 所 在 盘 块 号 为 10000+8=10008。 

再 来 计算 目录 大 小 和 读 写 性 能 。 采用 目录 分 解 方案 后 ,符号 目录 大 小 为 (1000*8)/512= 15.6 个 盘 
块 。 读 取 文 件 和 的 属性 时 ， 先 获取 符号 目录 ， 再 读 取 基本 目录 。 获 取 文件 包 的 符号 目录 项 的 最 少 、 
最 多 、 平 均 读 盘 次 数 为 1、16、8.5， 获 取 基 本 目录 项 需要 读 盘 1 次 。 合 起 来 ， 获 取 文件 侠 的 目录 项 
所 需 的 最 少 、 最 多 、 平 均 读 得 次 数 为 2、17、9.5。 

与 一 体 化 目录 方案 对 比 ， 平 均 读 盘 次 数 9.5 与 分 解 前 的 47.5 次 相 比 ， 仅 为 原来 的 20%， 性 能 大 
大 提高 。 因 此 ， 分 解 式 目录 管理 方案 被 Linux、UNIX 等 现代 操作 系统 广泛 采纳 。 
和 ”思考 与 练习 题 4.22 ”采用 “文件 目录 分 解法 ”， 每 个 盘 块 为 512 字 节 ， 分 解 前 每 个 目录 占 64 
字 节 ， 其 中 文件 名 占 8 字 节 。 分 解 后 ， 第 一 部 分 占 10 字 节 ( 包 括 文件 名 和 文件 内 部 号 )， 第 二 部 分 占 
56 字 节 (包括 文件 其 他 描述 信息 )， 文 件 内 部 号 占 2 字 节 。 

(1) 假设 某 一 目录 文件 共有 254 个 文件 控制 块 ， 试 分 别 给 出 采用 分 解法 前 后 ， 查 找 该 目录 中 某 
个 文件 控制 块 的 平均 读 盘 次 数 。 

(2) 一 般 情况 下 ， 若 目录 文件 分 解 前 占用 n 个 盘 块 ， 分 解 后 改 用 m 个 盘 块 存放 文件 名 和 文件 内 
部 号 ， 请 给 出 减少 读 盘 次 数 的 条 件 。 


4.5.5 ”Linux 分 解 式 目录 管理 


Linux 系统 采用 分 解 式 目录 管理 方法 : 文件 名 保存 在 文件 目录 中 ， 文 件 的 其 他 属性 (文件 大 小 、 
访问 权限 等 ) 保 存在 索引 节点 Grnodej 中 。 文 件 目录 实际 上 是 符号 目录 ，irnode 是 基本 目录 ， 将 所 有 
inode 放 到 磁盘 分 区 的 特定 区 域 ， 称 为 索引 节点 表 (i-node 表 )。 

4-19 显示 了 Linux 文件 目录 与 索引 节点 的 关系 。 当 需要 访问 某 个 文件 如 motd) 时 ，Linux 系 
统 先 在 文件 目录 中 找到 该 文件 的 索引 节点 号 (如 338), 再 以 索引 节点 号 为 索引 , 到 inode 表 中 找到 文 
件 的 其 他 信息 ， 包 括 文件 内 容 在 外 存 中 的 位 置 。 

在 Linux 系统 中 ， 索 引 节点 与 文件 一 一 对 应 。 若 两 个 文件 的 索引 节点 号 相同 ， 它 们 就 是 同一 文 
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件 。 在 图 4-19 中 ，newpassword 与 password 的 索引 节点 号 都 是 340， 它 们 是 同一 文件 的 两 个 名 字 ， 

此 链接 计数 代表 了 文件 有 多 少 个 名 字 。 同 样 ，motd 和 motd.bak 文件 也 是 同一 
个 文件 .指向 索引 节点 的 多 个 文件 名 都 是 其 他 文件 名 的 硬 链 接 , 可 用 “In f1 户 或 “om -1 有 1 2” 
命令 为 文件 生 创建 硬 链接 包 。 


文件 链接 计数 为 2， 因 


文件 目录 


文件 名 索引 节点 号 


book.bak 


$cd 
$cp .bashre bashrc 
$ls -1 bashre 


i-node 表 


文件 其 他 属性 
| 

文件 数据 在 
| 


图 4-19 Linux 文件 目录 与 索引 节点 关系 示意 图 


为 方便 操作 使 用 ，Linux 系统 除了 有 硬 链 接 概念 ， 还 有 符号 链接 ( 软 链接 ) 概 念 。 符 号 链接 是 文件 
的 一 种 快捷 方式 ， 符 号 链接 实际 上 仅 保存 某 个 文件 的 路 径 ， 用 命令 或 文件 读 写 函数 读 写 符号 链接 文 
件 时 ， 就 会 读 写 对 应 的 实际 文件 。 硬 链接 和 符号 链接 可 使 不 同 目录 的 文件 名 对 应 到 同一 个 文件 ， 这 
是 一 种 被 广泛 接受 的 文件 共享 方式 。 
以 下 代码 为 文件 bashre 建立 了 硬 链 接 和 快捷 方式 : 


-IW-I~I-- 1 root root 395 Jul 18 22:08 bashrc 


$cp -sbashre bashre slink 吕 In-s bashre bashre_slink 
Sp -1 bashrebashre hlink 或 In bashre bashre_ hlink 


Sls -1 bashre* 
-IW-I~I— 2 rootroot 
-IW-I~I— 2 rootroot 


395 Jul 18 22:08 bashrc 
395 Jul 18 22:08 bashrc_hlink 


# 建 立 符号 链接 

# 建 立 硬 链接 

# 显 示 目 录 列 表 ， 以 验证 是 否 创 建成 功 
## 这 是 原来 的 文件 

# 这 是 新 建 的 硬 链接 

# 两 个 文件 的 链接 计数 都 变 为 2 


lrwxrwxrwx 1rootroot 6Jul1822:31bashrc slink ->bashrc 


强 思考 与 练习 题 4.23 请 看 以 下 命令 输出 : 


Sls -li 

total 12 

1048914 drwxr-xr-x 
1053108 drwxr-xr-x 
1071284 -TWXI-XIT-X 
1234567 brw-r—r— 


29 can Toot 4096 
38 linux users 4096 
1 can can 7219 
1! Toot Toot El 


#4 新 建 的 符号 链接 


2014-04-05 09:27 can 
2012-11-30 14:31 linux 
2014-03-28 22:02 program 
2015-02-01 12:11 hdal 


请 问 : 文件 linux、program 的 文件 类 型 、 访 问 权 限 、 链 接 计 数 、 所 属 用 户 、 所 属 用 户 组 、 大 小 、 
更 新 时 间 与 索引 节点 号 分 别 是 什么 ? 


Li 
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ge 思考 与 练习 题 4.24 ”给 出 /、/etc/passwd、/bin/df、~ 等 文件 或 目录 的 索引 节点 号 、 类 型 、 存 
取 权 限 、 链 接 数 、 所 有 者 、 组 、 文 件 大 小 等 信息 。 


4.5.6 读 取 文件 元 数据 


大 多 数 文件 操作 主要 是 读 写 文件 内 容 ， 但 有 些 时 候 也 需要 读 取 时 间 、 类 型 、 访 问 权限 等 文件 属 
性 。Linux 提供 了 stat 和 fstat 等 函数 ， 从 文件 的 索引 节点 读 取 文件 属性 信息 (又 称 元 数据 ,metadata)， 
填写 stat 结构 体 。 

#include <unistd h> 

#include <sys/stath> 

int stat(const char *filename , struct stat *buf): 

int fstat(int fd , struct stat *buf); 


返回 值 ; 若 成 功 ， 则 为 0; 若 出 错 ， 则 为 -1。 
两 个 函数 的 功能 相同 ， 不 同 之 处 在 于 : stat 函数 以 文件 名 作为 输入 ，fstat 函数 以 文件 描述 符 而 
不 是 文件 名 作为 参数 。stat 结构 体 的 定义 如 下 : 


struct stat { 
mode t st_ mode: 上 证 文件 类 型 、 权 限 等 */ 
ino 1 st_ino; 旋 inode 节点 号 *#/ 
devt st_dev: 话 设备 号 码 */ 


devt st_rdev: 上 # 特殊 设备 号 码 */ 
nlink t st_nlink: 片 文件 的 链接 数 */ 


uid t st_uid; 上 # 文件 所 有 者 */ 
gidt st_gid: 上 # 文件 所 有 者 对 应 的 组 */ 
off t st_size; 上 # 普通 文件 ， 对 应 的 文件 字 节 数 */ 


time t st_atime; 。 ”证 文件 最 后 被 访问 的 时 间 */ 

time + st_mtime; 。 ”人 + 文件 内 容 最 后 被 修改 的 时 间 */ 

time t st_ctime: 让 文件 状态 改变 时 间 *#/ 

blksize t ”st_blksize: 上 # 文件 内 容 对 应 的 块 大 小 志 

blkcnt t st_blocks: 上 文件 内 容 对 应 的 块 数量 */ 
ys 
st_size 成 员 包 含 文件 的 字 节 数 。st_mode 成 员 则 编码 文件 访问 权限 位 和 文件 类 型 ， 文 件 类 型 有 
普通 文件 、 目 录 文 件 、 套 接 字 、 管 道 、 块 设备 、 字 符 设 备 、 符 号 链接 七 种 类 型 。UNIX 提供 的 宏 指 
令 根 据 st mode 成 员 来 确定 文件 的 类 型 ，S_ ISREG、S_ISDIR、S_ISSOCK 宏 分 别 根据 st mode 成 员 
来 判断 是 否 为 普通 文件 、 目 录 文 件 和 网 络 套 接 字 。 

下 面 的 程序 getmetal.c 演示 了 如 何 使 用 这 些 宏和 stat 函数 来 读 取 和 解释 一 个 文件 的 st_mode 位 。 


访 getmetalc 源 代码 */ 
1  #include <stdioh> 
#include <sys/stat h> 
#include <fentlh> 
#include <stdioh> 
#include <stdlibh> 
int main (int argc , char **argv) 
{ 
struct stat buf: 
char *type, *readok: 


oomph 
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10 stat(argv[1] . &buf): 
11 让 (S_ ISREG(bufst mode)) 。/* 判断 文件 类 型 */ 


iz type = "regular"; 

13 else if (S_ISDIR(buf'st_ mode)) 

14 type="directory"; 

15 else 

16 type = "other"; 

17 让 (bufst mode & S IRUSR)) /* 检查 访问 权限 */ 
18 readok="yes"; 

19 else 


20 readok="no"; 
21 
22 Printf ("type: %s , read: %s \n", type , readok): 
23 exit(0): 

24 } 

下 面 进行 编译 和 测试 : 

Sgcec -0 getmetal getmetal.c 

S$ /getmetal getmetal 

type: regular, read: yes 

S$ /getmetal . 

type: directory , read: yes 
”思考 与 练习 题 4.25 ”编写 程序 LS.c， 显 示 当 前 目录 下 的 文件 列表 ， 每 行 显示 一 个 文件 的 信 
息 ， 每 个 文件 要 显示 文件 名 、 文 件 大 小 和 索引 节点 号 。 


4.5.7 文件 搜索 和 当前 目录 


一 个 磁盘 分 区 或 文件 系统 安装 后 ， 系 统 自动 将 其 根 目录 读 入 内 存 。 要 读 写 文件 ， 需 要 从 根 目录 
开始 ， 顺 着 文件 路 径 ， 先 获取 文件 目录 项 ， 再 执行 打开 和 读 写 操作 。 比 如 ， 获 取 
CN\WINDOWS\system32\drivers\etc\hosts 目录 项 的 过 程 为 : 

@ 从 内 存 的 Cx\ 目 录 表 中 读 取 目 录 C:\WINDOWS 的 数据 区 的 盘 块 号 , 将 WINDOWS 目录 内 容 
读 至 内 存 ， 其 内 容 是 C\WINDOWS 目录 表 ; 

@ 从 CNYWINDOWS 目录 表 中 取得 system32 数据 区 盘 块 号 ， 将 system32 内 容 读 至 内 存 ， 其 内 
容 是 system32 目录 ; 

@ 从 system32 目录 中 取得 drivers 数据 区 盘 块 号 ， 将 drivers 内 容 读 至 内 存 ， 其 内 容 是 drivers 
目录 ; 

由 从 drivers 目录 中 取得 etc 数据 区 盘 块 号 ， 将 etc 内 容 读 至 内 存 ， 其 内 容 是 etc 目录 ; 

@ 最 后 从 etc 目录 中 取得 hosts 文件 目录 项 ， 然 后 存 取 该 文件 。 

显然 , 由 根 目 录 C:\ 开 始 获 取 文 件 目录 项 的 开销 受 路 径 长 度 影响 很 大 。 为 提高 文件 搜索 效率 ， 多 
数 操 作 系 统 会 为 进程 设置 当前 目录 ， 并 将 当前 目录 的 内 容 读 入 内 存 。 上 述 问题 中 ， 若 设置 当前 目录 
为 C\WINDOWS\system32， 文 件 搜索 时 间 可 节省 约 一 半 。 

Linux 系统 采用 分 解 式 目 录 ， 符 号 目录 为 文件 目录 ， 基 本 目录 项 称 为 i 节点 ， 以 图 4-20 演示 的 
搜索 文件 srastmbox 为 例 ， 从 根 目 录 开 始 搜索 该 文件 的 i 节点 需要 六 步 : 

G@ 从 分 区 的 根 目录 /目录 表 中 查找 usr， 得 到 其 i 节点 号 7; 
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块 496 为 
i 节点 62 目录 /usr/ast 
图 从 i 节 点 62 得 | 
到 /usr/ast 内 
容 所 在 盘 块 号 
@ 取 得 /usr/ast 496 加 取得 
的 i 节点 号 62 /usr/ast/mbox 
@ 查 找 usr， 得 的 i 节点 号 80 


到 二 节点 号 7 


4-20 Linux 系统 中 文件 搜索 示例 


@ 读 取 i 节点 区 第 7 项 内 容 ， 从 中 得 到 /usr 内 容 盘 块 号 128; 

@ 读 取 128 号 磁盘 块 到 内 存 ， 得 到 /usr 目录 表 ， 搜 索 /usr 目录 ， 取 得 ast 的 i 节点 号 62; 

@ 读 取 从 i 节点 区 第 62 项 内 容 ， 搜 索 /usr/ast 目录 表 所 在 盘 块 号 为 496; 

加 读 取 496 号 磁盘 块 到 内 存 ， 得 到 /usrast 目录 表 ， 从 中 检索 mbox 的 i 节点 号 为 80; 

@ 最 后 ， 读 取 i 节 点 区 第 80 项 内 容 ， 得 到 /usrasymbox 的 文件 属性 。 

不 难 理解 ， 如 果 设 置 当 前 目录 为 /usr 或 /usr/ast， 并 将 当前 目录 的 目录 表 提前 读 入 内 存 ， 则 文件 
搜索 开销 也 会 大 为 减 小 。 
寻思 考 与 练习 题 4.26 为 何 多 数 操作 系统 要 为 进程 设置 当前 目录 ? 


四 9 文件 物理 结构 _ 


前 面 介绍 了 文件 逻辑 地 址 与 物理 地 址 的 概念 ， 讲 述 了 文件 属性 的 管理 与 文件 目录 项 的 组 织 。 本 
节 讨 论文 件 存储 空间 管理 ， 包 括 磁盘 分 配 、 空 闲 块 管理 与 分 区 结构 等 。 


4.6.1 外 存 组 织 方式 


外 存 组 织 方式 又 称 文件 物理 结构 ， 指 文件 系统 采取 何 种 策略 将 磁盘 空间 分 配给 文件 使 用 ， 以 及 
文件 如 何 登记 分 配 自 己 的 磁盘 块 ， 实 际 上 是 指 分 区 的 文件 系统 格式 。 外 存 组 织 方式 一 般 有 连续 组 织 
方式 、 链 接 组 织 方式 和 索引 组 织 方式 三 种 。 


1. 连续 组 织 方式 


连续 组 织 方式 是 指 为 每 个 文件 分 配 一 片 盘 块 号 连续 的 磁盘 空间 ， 由 此 形成 的 文件 物理 结构 称 为 
顺序 式 的 文件 结构 , 简称 顺序 文件 。 采用 连续 组 织 方式 , 文件 目录 项 中 只 登记 首 个 数据 块 的 盘 块 号 ， 
外 加 盘 块 数 或 字 节 数 表示 的 文件 长 度 ， 如 图 4-21 所 示 。 

连续 组 织 方式 的 优点 是 顺序 访问 速度 快 ， 不 足 在 于 多 次 创建 和 删除 文件 后 ， 如 果 要 创建 比较 大 
的 文件 ， 想 要 找到 足够 数量 的 号 连续 的 磁盘 块 会 比较 难 ， 致 使 磁盘 空间 利用 率 不 高 ， 这 种 组 织 方式 
比较 适合 文件 一 旦 创建 就 不 再 修改 的 场合 ， 如 银行 交易 记录 备份 。 
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9 ae 文件 名 ” 起 始 盘 块 号 大 小 (前 块 数 ) 
| st | Pn | count 0 2 

‘DO | gi 

1 tr 

和 1 中 1 sa list 28 . 

"3 f 6 2 


4-21 文件 连续 组 织 方式 


和 思考 与 练习 题 4.27 考虑 图 4-21 所 示 的 文件 结构 。 

(1) 给 出 文件 mail 的 逻辑 地 址 与 磁盘 块 号 的 对 应 关系 。 

(2) 若 盘 块 大 小 为 512 B， 请 计算 文件 mail 中 字 节 编号 (或 偏 移 量 ) 为 1000 的 字 节 在 哪个 盘 
块 中 ? 


2. 链接 组 织 方式 


链接 组 织 方式 是 指 为 每 个 文件 分 配 盘 块 号 不 连续 的 磁盘 空间 ， 通 过 链接 指针 将 一 个 文件 的 所 有 
盘 块 按 顺序 链接 在 一 起 ， 由 此 形成 链接 式 文件 结构 ， 简 称 链接 文件 。 有 两 种 实现 方案 ， 隐 式 链接 和 
显 式 链接 。 

(1) 隐 式 链接 

在 隐 式 链接 中 ， 每 条 逻辑 记录 都 保存 下 一 条 届 辑 记录 的 磁盘 号 ， 使 各 罗 辑 记录 通过 形成 类 似 链 
表 的 结构 ， 在 文件 目录 项 中 包含 指向 起 始 和 末尾 逻辑 记录 的 盘 块 号 ， 图 4-22 是 一 个 示例 。 其 好 处 是 
磁盘 空间 利用 率 高 ， 缺 点 是 随机 访问 速度 慢 ， 因 为 要 读 写 逻辑 记录 n 中 的 数据 ， 必 须 按 顺 序 读 出 逻 
辑 记 录 0、 逻 辑 记 录 1、...、 逻 辑 记 录 n-1， 需 要 读 磁 盘 n 次 ， 同 时 链接 指针 一 旦 破坏 ， 文 件 内 容 即 
丢失 ,可靠 性 差 。 目 前 这 种 文件 组 织 方式 很 少见 。 
文件 名 起 始 ” 末 盘 块 号 ”文件 大 … 

盘 块 号 小 字 节 ) 
count 9 25 2500 
一 


图 4-22 隐 式 链接 组 织 方式 
多” 思考 与 练习 题 4.28 考虑 图 4-22 所 示 的 文件 结构 。 
(1) 给 出 文件 count 的 逻辑 块 号 与 磁盘 块 号 的 对 应 关系 。 
(2) 若 盘 块 大 小 为 S12 B， 请 计算 文件 count 中 字 节 编号 (或 偏 移 量 ) 为 1000 的 字 节 在 哪个 盘 
块 中 ? 
(3) 写 出 将 1 字 节 内 容 c 写 入 文件 count 中 偏 移 量 为 d 位 置 的 程序 代码 。 假 设 库 函 数 Teaddisk(char 
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*buf, int block) 将 盘 块 号 为 block 的 内 容 读 到 缓冲 区 buf writedisk(char *buf int block) 将 缓冲 区 buf 的 
内 容 写 到 盘 块 block。 

(2) 显 式 链接 

显 式 链接 组 织 方式 是 指 为 整个 磁盘 或 磁盘 分 区 设置 一 个 表 ， 每 个 表 项 的 序号 与 磁盘 块 号 对 应 ， 
其 中 保存 文件 下 一 个 数据 块 (或 逻辑 记录 ) 所 在 的 盘 块 号 ， 将 记录 的 盘 块 号 看 成 指针 值 ， 就 在 整个 磁 
盘 或 分 区 ， 形 成 多 条 链 。 每 个 文件 对 应 其 中 一 条 链 ， 最 后 一 个 盘 块 对 应 的 表 项 填 0， 将 链 首 盘 块 号 
写 入 文件 目录 。 由 于 分 配给 文件 的 所 有 盘 块 号 都 放 在 该 表 中 ， 因 此 把 该 表 称 为 文件 分 配 表 (File 
Allocation Table，FAT)， 如 图 4-23 所 示 。 

显 式 链接 组 织 方式 将 整个 文件 分 配 表 置 于 一 片 连续 的 磁盘 块 中 ， 所 占 空间 不 大 ， 可 预先 将 整个 
FAT 读 入 内 存 。 若 随机 读 写 菜 条 人 逻辑 记录 的 内 容 ， 可 在 内 存 中 遍历 链表 ， 找 到 其 磁盘 块 号 ， 读 写 一 
次 磁盘 块 即 可 。Windows 环境 下 的 FAT、FAT 16、FAT 32 文件 系统 就 采用 显 式 链接 组 织 方式 。 

文件 目录 得 块 号 FAT 


文件 名 起 始 文件 大 … | 
盘 块 号 _ 小 ( 字 鞠 


count_2 2000 三 


图 4-23 显 式 链接 组 织 方式 


由 于 文件 分 配 表 (FAT) 对 整个 文件 系统 来 说 至 关 重 要 ， 为 防止 磁盘 块 遭 受 破坏 或 算 改 ， 提 高 文 
件 组 织 的 可 靠 性 ， 一 般 在 磁盘 分 区 的 不 同位 置 保存 多 个 FAT 副本 。 

(3) Windows 文件 系统 格式 

Windows 是 采用 链接 组 织 方式 的 典型 系统 , 早期 的 DOS 采用 FAT 12 和 FAT 16 格式 , Windows 
95、Windows 98 采用 FAT 32 格式 ，Windows NT、Windows 2000 和 Windows XP 引入 NTFS 格式 。 

FAT 12 以 盘 块 为 磁盘 空间 分 配 的 基本 分 配 单位 , 用 每 项 宽度 为 12 位 的 FAT 管理 属于 各 文件 的 
数据 块 间 的 先后 顺序 ， 实 现 逻 辑 块 号 到 磁盘 块 号 的 映射 关系 ， 如 图 4-24 所 示 。 在 每 个 分 区 中 都 配 有 
两 张 相 同 的 文件 分 配 表 FAT1 和 FAT2。 
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图 4-24 Windows 文件 系统 格式 


FAT 12 的 问题 是 每 个 FAT 表 项 仅 为 12 位 ,在 FAT 表 中 最 多 允许 有 4096 个 表 项 。 若 每 个 盘 块 
的 大 小 为 512 字 节 ， 则 仅 支 持 容量 不 超过 2MB(4096x512B) 的 分 区 ; 若 一 个 物理 磁盘 最 多 划分 4 个 
分 区 ， 则 磁盘 最 大 容量 仅 为 SMB。 
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一 种 改进 方法 是 以 簇 (一 组 相 邻 的 扇 区) 为 单位 分 配 磁盘 空间 ， 簇 的 大 小 通常 为 1 个 扇 区 (512B)、 
2 个 扇 区 (IKB)、4 个 扇 区 (2KB)、8 个 扇 区 (4KB) 等 。 这 样 磁盘 分 区 大 小 最 大 可 达 64MB， 远 不 能 支 
持 现 代 的 大 容量 硬盘 。 另 一 种 方法 是 把 FAT 位 数 增加 到 16 位 , 称 为 FAT 16 文件 系统 格式 , 将 FAT 
长 度 增 至 65536， 同 时 每 个 簇 可 以 拥有 的 盘 块 数 可 设置 为 4、8、...、64， 可 管理 的 最 大 磁盘 分 区 可 
达 216x64x512= 2GB， 但 仍然 无 法 满足 大 容量 分 区 要 求 。 

为 支持 大 容量 硬盘 ， 微 软 将 FAT 文件 系 升 级 到 FAT 32， 将 FAT 宽度 增加 到 32 位 ， 将 每 复 大 
小 降低 到 4KB(8 个 盘 块 )， 可 管理 的 硬盘 大 小 达 2TB， 较 好 地 缓解 了 FAT 文件 系统 对 大 容量 磁盘 的 
支持 问题 。 

随 着 技术 和 应 用 的 发 展 ，FAT 文件 系统 的 若干 缺陷 也 不 断 凸显 出 来 : 一 是 不 支持 即将 普遍 使 用 
的 2TB 以 上 大 容量 硬盘 二 是 不 能 设置 访问 权限 。 从 Windows NT 后 ， 微 软 公 司 推出 NTFS 文件 系 
统 格式 来 解决 这 些 问 题 ， 特 性 有 : @D 使 用 64 位 磁盘 地 址 ， 完 全 解决 对 大 容量 硬盘 的 支持 问题 ; @ 支 
持 长 文件 名 ， 单 个 文件 名 可 达 255 个 字符 ， 全 路 径 名 可 达 32767 个 字符 ， 文 件 命名 灵活 ; @@ 具 有 系 
统 容错 功能 ， 可 靠 性 好 ; @@ 可 按 用 户 、 用 户 组 设置 访问 权限 ， 安 全 性 强 。 


哆 “思考 与 练习 题 4.29 

(1) 已 知 磁盘 容量 为 236MB， 往 大 小 为 4KB， 对 FAT 16 格式 的 文件 系统 来 说 ， 文 件 分 配 表 应 
该 占用 多 大 磁盘 空间 ? 

(2) 有 一 个 大 小 为 500MB 的 硬盘 ， 答 大 小 为 IKB， 若 采用 FAT 16 文件 系统 格式 ， 试 计算 FAT 
的 大 小 。 


3. 索引 组 织 方式 


将 分 配给 文件 的 盘 块 号 登记 在 一 个 专门 的 索引 块 中 ， 由 此 形成 的 文件 物理 结构 ， 称 为 索引 式 的 
文件 结构 , 简称 索引 文件 。 索 引 组 织 方式 可 解决 顺序 文件 扩展 不 灵活 和 链接 文件 FAT 开销 大 的 问题 。 

最 直观 的 做 法 是 将 磁盘 块 号 放 到 单个 索引 表 中 ， 称 为 单 级 索引 。 为 了 支持 容量 较 大 的 文件 ， 索 
引 表 不 能 太 小 ， 但 对 中 小 型 文件 来 说 ， 存 在 索引 表 利 用 率 低 而 浪费 空间 的 问题 。 因 此 UNIX、Linux 
都 采用 多 级 组 织 方式 ， 又 称 增 量 式 组 织 方式 ， 其 基本 思想 是 在 文件 索引 节点 中 设置 13 个 索引 项 , 其 
中 iaddr(0) 一 iaddr(9) 为 直接 索引 项 ,iaddr(10) 提 供 一 次 间接 地 址 ,iaddr(11) 提 供 二 次 间接 地 址 ,iaddr(12) 
提供 三 次 间接 地 址 ， 如 图 4-25 所 示 。 


图 4-25 多 级 索引 组 织 方式 
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采用 多 级 索引 组 织 方式 , 文件 前 10 条 逻辑 记录 0、1、2、...、9 的 盘 块 号 依次 保存 在 iaddr(0) 一 
iaddr(9) 中 ; iaddr(10) 中 登记 一 个 直接 索引 块 的 盘 块 号 ， 索 引 块 也 是 一 个 磁盘 块 ， 假 设 一 个 索引 块 中 
可 登记 1024 个 盘 块 号 ， 则 该 索引 块 登记 逻辑 块 号 10~1033 对 应 的 盘 块 号 ; iaddr(11) 登 记 一 个 间接 索 
引 块 的 盘 块 号 ， 该 索引 块 中 又 登记 1024 个 直接 索引 块 的 盘 块 号 ， 每 个 直接 索引 块 登记 1024 条 逻辑 
记录 的 盘 块 号 ， 因 此 在 iaddr(11) 下 登记 的 数据 块 有 10242 个 ; 以 此 类 推 ， iaddr(12) 登 记 一 个 三 次 间接 
地 址 ， 在 其 下 登记 的 数据 块 数 有 1024 个 。 

结 思考 与 练习 题 4.30 某 文件 系统 采用 增 量 式 多 级 索引 组 织 ， 其 索引 节点 中 共有 13 个 地 址 项 ， 
第 0~9 个 地 址 项 为 直接 地 址 ， 第 10 个 地 址 项 为 一 次 间接 地 址 ， 第 11 个 地 址 项 为 二 次 间接 地 址 ,第 
12 个 地 址 项 为 三 次 间接 地 址 。 如 果 每 个 盘 块 的 大 小 为 4B， 盘 块 号 需要 用 4 个 字 节 来 表示 ， 计算 该 
系统 中 允许 的 最 大 文件 长 度 。 

和 思考 与 练习 题 4.31 某 文件 系统 采用 图 4-25 所 示 的 增 量 式 索 引 组 织 方式 ， 若 盘 块 为 4KB， 每 
块 可 放 1024 个 盘 块 号 , 计算 偏 移 地 址 为 下 列 数值 的 字 节 所 在 数据 块 的 逻辑 块 号 , 读 出 该 处 1 字 节 数 
据 需 要 读 盘 几 次 ? 

O000 ©®180000 @® 4200000 


4.6.2 ”管理 磁盘 空闲 盘 块 


设计 一 个 物理 文件 系统 ， 除 文件 组 织 方式 外 ， 还 涉及 磁盘 空闲 空间 的 管理 。 一 般 有 空闲 表 法 、 
空闲 链表 法 、 位 示 图 法 、 成 组 链接 法 等 管理 方法 。 


1. 空闲 表 法 和 空闲 链表 法 


这 是 两 种 比较 直观 的 空闲 盘 块 管理 方法 。 空 闲 表 法 为 外 存 中 的 所 有 空闲 区 建立 一 张 空闲 表 ， 每 
个 空闲 区 对 应 一 个 空闲 表 项 ， 其 中 包括 表 项 序号 、 该 空闲 区 的 第 一 个 盘 块 号 、 该 空闲 区 的 空闲 盘 块 
数 等 信息 。 系 统 也 将 所 有 空闲 区 按 起 始 盘 块 号 递增 的 次 序 排列 ， 形 成 空闲 盘 块 表 。 这 种 方法 为 每 个 
文件 分 配 一 块 连续 的 存储 空间 ， 仅 适合 文件 连续 组 织 方式 。 

空闲 链表 法 将 所 有 空闲 盘 区 拉 成 一 条 空闲 链 ， 根 据 构成 空闲 链 所 用 基本 元 素 的 不 同 ， 可 把 链表 
分 成 两 种 形式 。 一 种 是 ， 空 闲 盘 块 链 将 磁盘 上 的 所 有 空闲 空间 ， 以 盘 块 为 单位 拉 成 一 条 链 ， 其 中 的 
每 一 个 盘 块 都 有 指向 后 继 盘 块 的 指针 。 盘 块 分 配 简单 方便 ， 分 配 和 回收 效率 较 低 ， 相 应 的 空闲 盘 块 
链 会 很 长 。 另 一 种 是 ， 空 闲 盘 块 链 将 磁盘 上 的 所 有 空闲 盘 区 (每 个 盘 区 可 包含 若干 个 盘 块 ) 拉 成 一 条 
链 。 空 闲 链表 法 还 存在 可 靠 性 差 的 问题 ， 一 旦 断 链 ， 系 统 空闲 盘 块 即 丢失 ， 因 此 一 般 不 太 使 用 。 


2. 位 示 图 法 


位 示 图 利用 一 个 比特 来 表示 磁盘 中 一 个 盘 块 的 使 用 情况 。 当 值 为 “0” 时 , 表示 对 应 的 盘 块 空闲 ; 
值 为 “1” 时 ， 表 示 已 分 配 。 磁 盘 上 的 所 有 盘 块 都 有 一 个 比特 与 之 对 应 ， 这 样 ， 由 所 有 盘 块 对 应 的 比 
特 构成 一 个 集合 ， 称 为 位 示 图 。 通 常 把 位 示 图 看 成 m 个 位 宽 为 n 的 字 ， 表 示 成 一 个 m 行 n 列 的 表 
格 ， 图 4-26 显示 了 每 行为 16 位 的 位 示 图 。 

采用 这 种 方法 , 可 方便 地 计算 点 位 图 位 置 与 盘 块 号 的 对 应 关系 。 已 知 位 示 图 某 位 的 位 置 为 G, j)， 
盘 块 号 =i*n 菇 ， 若 已 知 盘 块 号 ， 则 i=|k/n|, j=kmodn。 
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图 4.26 ”空闲 盘 块 管理 的 位 示 图 法 
2 思考 与 练习 题 4.32” 某 计算 机 系统 采用 如 图 4-26 所 示 的 位 示 图 ( 行 号 、 列 号 都 从 0 开始 编号 ) 
来 管理 空 闸 盘 块 。 假 设 盘 块 从 0 开始 编号 ， 每 个 盘 块 的 大 小 为 IKB。 

(1) 现在 要 为 文件 分 配 两 个 盘 块 ， 试 具体 说 明 分 配 过 程 。 

(2) 若 要 释放 磁盘 的 第 300 块 ， 应 如 何 处 理 ? 

3. 成 组 链接 法 


成 组 链接 法 利用 空闲 块 本 身 的 空间 来 登记 管理 空闲 块 资源 ， 可 以 说 完全 消除 了 管理 空闲 块 的 存 
储 开 销 ， 图 4-27 展示 了 其 基本 思想 。 
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图 4-27 用 成 组 链接 法 管理 空闲 盘 块 


@ 将 所 有 空闲 盘 块 分 成 若干 组 ， 比 如 ,将 每 100 个 盘 块 作为 一 组 , 设置 一 个 空闲 盘 块 号 栈 , 其 
容量 与 盘 块 大 小 一 致 ， 用 来 存放 第 一 组 空闲 块 的 盘 块 号 和 栈 中 尚 有 的 空闲 盘 块 数 。 图 4-27 的 左 部 
展示 了 空闲 盘 块 号 栈 的 结构 。 假 设 栈 中 最 多 登记 100 个 盘 块 号 ，S.free(0) 是 栈 底 ， 栈 满 时 的 栈 顶 为 
S free(99)。 

@ 其 他 各 组 空闲 块 的 盘 块 号 和 盘 块 总 数 登 记 到 前 一 组 空闲 块 中 的 第 一 个 盘 块 中 ， 对 应 
S.free(0)， 如 图 4-27 的 右 部 所 示 。 

@ 由 各 组 的 第 一 个 盘 块 可 链 成 一 条 链 , 将 第 一 组 的 盘 块 总 数 和 所 有 的 盘 块 号 , 记 入 空闲 盘 块 号 
栈 ， 作 为 当前 可 供 分 配 的 空闲 盘 块 号 。 
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@ 最 末 一 组 只 有 99 个 盘 块 , 其 盘 块 号 分 别 记 入 其 前 一 组 的 S.free(1) 一 S.free(99), 而 在 S.free(0) 
中 则 存放 “0”， 作 为 空闲 盘 块 链 的 结束 标志 。 

新 建文 件 需要 分 配 空闲 盘 块 时 ， 总 是 先 把 空闲 盘 块 号 栈 最 下 面 的 盘 块 分 配 出 去 ， 如 果 选 择 分 配 
的 盘 块 号 是 S.free(0)， 在 图 4-27 中 是 300 号 盘 块 ， 由 于 该 盘 块 登记 了 其 他 的 空闲 盘 块 号 ， 应 先 把 该 
盘 块 中 的 盘 块 号 复制 到 专用 块 中 。 删 除 一 个 文件 时 ， 将 归还 的 盘 块 号 登记 到 专用 块 中 。 如 果盘 块 栈 
已 经 填 满 ， 将 盘 块 栈 中 的 盘 块 号 填 入 刚 归 还 的 盘 块 中 ， 而 把 刚 归 还 的 盘 块 号 填 入 S.free(0)， 盘 块 栈 
中 盘 块 数 置 1。 
$e * 思 考 与 练习 题 4.33 UNIX 系统 采用 把 空闲 块 成 组 链接 的 方法 管理 磁盘 空 闸 空间， 图 4-28 是 
空闲 块 成 组 链接 示意 图 ， 此 时 若 文件 A 需要 5 个 盘 块 ， 系 统 会 将 哪些 盘 块 分 配给 它 ? 若 之 后 文件 了 B 
被 删除 ， 它 占用 的 盘 块 号 为 333、334、404、405、782， 则 回收 这 些 盘 块 后 专用 块 的 内 容 如 何 ? 
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4-28 ”空闲 块 成 组 链接 示意 图 


4.6.3 文件 系统 结构 格式 


分 区 格式 是 文件 系统 类 型 ， 涉 及 根 目录 在 哪里 ， 点 位 图 区 、 索 引 节点 区 位 于 何 处 ， 大 小 多 少 等 
信息 ， 这 些 信息 都 应 该 以 某 种 约定 的 方式 告知 操作 系统 ， 以 便 进行 装载 。 这 里 以 ext2 文件 系统 格 
式 为 例 予 以 介绍 。 

ext2 文件 系统 格式 如 图 4-29 所 示 , 分 区 最 前 面 的 扇 区 是 引导 记录 , 存放 NT Loader、 Lilo、GRUB 
等 引导 程序 代码 ， 之 后 才 属 于 ext2 文件 系统 。ext2 文件 系统 将 分 区 划分 为 多 个 块 组 ， 每 个 块 组 由 很 
多 区 块 (block) 构 成 ， 每 个 区 块 的 大 小 有 1KB、2KB 及 4KB 三 种 ， 内 存 与 磁盘 间 以 区 块 为 单位 传递 
数据 。 每 个 块 组 依次 包括 超级 块 (superblock)、 文 件 系 统 描 述 、 块 位 图 (block bitmap)、 索 引 节点 位 图 
(inode bitmap)、 索 引 节点 表 (inode table)、 数 据 块 区 (data block)。 

superblock 用 于 管理 文件 系统 的 基本 信息 ， 包 括 : 块 (block) 与 索引 节点 (inode) 总 量 ; 未 使 用 与 已 
使 用 的 inode、block 数量 ; block 与 inode 的 大 小 ; block bitmap、inode bitmap、inode table 的 位 置 等 。 
文件 系统 描述 说 明 每 个 block group 的 开始 与 结束 盘 块 号 ， 以 及 说 明 每 个 区 段 分 别 介 于 哪 一 个 block 
块 号 之 间 。block bitmap 描述 哪些 block 是 空闲 的 ， 哪 些 已 经 分 配给 文件 使 用 。inode bitmap 描述 哪 
些 inode 是 空闲 的 ,哪些 已 经 分 配给 文件 使 用 。 当 执行 mount 命令 挂 载 某 个 分 区 时 , 系统 从 superblock 
获得 文件 系统 格式 信息 ， 通 过 它 可 找到 所 有 文件 属性 、 数 据 信息 和 空闲 块 信息 。 
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4-29 ext2 文件 系统 结构 


data block 


本 章 小 结 


Linux 仅 提 供 open、close、read、write、lseek、dup 等 少量 的 UNIX IO 系统 调用 函数 ， 允 许 应 
用 程序 打开 、 关 闭 、 读 写 文件 ， 移 动 文件 指针 ， 读 取 文件 元 数据 ， 实 现 VO 重 定向 等 。 但 UNIX IO 
函数 的 功能 不 够 丰富 灵活 ， 给 应 用 编程 带 来 不 便 ， 而 且 每 次 调用 都 要 陷入 内 核 ， 函 数 调用 开销 较 大 。 

基于 UNIX VO 实现 的 标准 IO 库 提供 了 一 组 强大 的 高 级 IO 例 程 ,如 fopen、felose、fread、fwrite、 
fseek、fgetc、fgets、fprintf、fscanf， 方 便 按 数 据 块 、 文 本 行 读 写 文件 ， 支 持 数 据 格式 化 处 理 ， 通 过 
设置 用 户 态 缓冲 区 来 减少 内 核 陷 入 次 数 ， 大 大 提高 文件 读 写 效率 。 对 于 大 多 数 文件 读 写 应 用 而 言 ， 
标准 IO 更 简单 方便 ， 是 优 于 UNIXIO 的 选择 。 但 由 于 标准 WO 和 网 络 通信 存在 不 兼容 问题 ， 在 网 
络 应 用 编程 中 仍 需要 直接 使 用 UNIX IO 函数 进行 网 络 编程 。 

然而 ， 直 接 使 用 UNIX IO 系统 函数 读 写 数据 时 ， 存 在 不 足 值 问题 ， 也 不 方便 按 行 读 入 。 基 于 
UNIX IO 实现 的 RIO 包 ， 通 过 反复 执行 读 写 操作 ， 直 到 传送 完 所 有 的 请 求 数 据 ， 自 动 处 理 不 足 值 ， 
支持 按 行 读 取 数 据 ， 适 合 在 网 络 编程 中 使 用 。 

不 过 ，UNIX IO 是 操作 系统 文件 管理 组 成 部 分 之 一 , 学习 它 对 于 理解 操作 系统 的 文件 系统 原理 
有 很 大 帮助 。Linux 内 核 使 用 三 个 相关 的 数据 结构 来 表示 打开 的 文件 。 描 述 符 表 中 的 表 项 指向 文件 
对 象 (打开 文件 的 file 结构 )， 而 文件 对 象 又 指向 v-node 对 象 。 每 个 进程 都 有 独立 的 描述 符 表 ， 而 所 
有 进程 共享 同一 个 文件 对 象 表 和 v-node 表 。 学习 UNIX LO 内 核 数 据 结 构 是 理解 管道 、VO 重 定向 和 
守护 进程 工作 原理 的 基础 ， 也 有 助 于 编写 方便 易 用 的 网 络 通信 和 应用。 

要 理解 Linux 等 操作 系统 的 工作 原理 ， 还 有 必要 学 习 文 件 系统 结构 。 它 包括 两 个 方面 : 一 是 文 
件 组 织 ， 包 括 文件 目录 的 组 织 方式 、 逻 辑 地 址 和 物理 地 址 的 概念 ， 这 些 有 助 于 理解 文件 搜索 的 原理 
与 当前 目录 的 意义 ， 以 便 更 高 效 操作 文件 ， 编 写 更 高 效 的 文件 操作 代码 ， 二 是 文件 物理 结构 ， 包 括 
顺序 、 链 接 和 索引 三 种 外 存 组 织 方式 与 应 用 场合 ， 文 件 空闲 空间 管理 方法 以 及 物理 文件 系统 格式 。 


课 后 作业 


和 思考 与 练习 题 4.34 编写 程序 Catc， 实 现 命令 cat 的 功能 以 显示 文本 文件 内 容 ， 比 如 : 当 
执行 “/Cat /etc/passwd” 命 令 时 ， 在 终端 显示 文件 /etc/passwd 的 内 容 。 
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和 思考 与 练习 题 4.35 编写 程序 Hex.c， 以 十 六 进 制 形式 显示 文件 内 容 ， 每 个 字 节 用 两 个 十 六 
进 制 数字 表示 ， 每 行 显示 40 个 字 节 内 容 。 比 如 字符 'a' 的 ASCII 码 是 0x61， 如 果菜 个 文件 的 内 
容 是 "aaaa"， 则 显示 结果 应 该 是 "61 61 61 61"。 
各 ”思考 与 练习 题 4.36 假设 文件 infile 的 内 容 是 "abcdefghijklmnopqrstuvwxyzm"， 请 写 出 以 
下 程序 的 输出 结果 : 
#include <stdio h> 
#include <sys/stat h> 
#include <fcntlh> 
intmain0 
{ 
int fd, locl, loc2: 
char ch; 
fd=open("infile".O_RDONLY.0): 
locl=lseek(fd, 10, SEEK_CUR): 
Tead(fd, &ch, 1); 
loc2=lseek(fd, 0, SEEK_ END); 
printft"loc1=96d ch=%c, loc2=%d\n",locl., ch, loc?); 
close(fd): 
} 
于 = 思考 与 练习 题 4.37 有 一 个 元 素 类 型 为 工 的 数组 a,， 定义 为 “T alN];”， 其 中 和 为 常量 , 已 
将 数组 a 写 入 新 文件 fa， 描述 符 为 亿 。 
(1) 计算 元 素 a[k] 距 数组 a 起 始 位 置 的 字 节 偏 移 量 。 
(2) 计算 元 素 a[k] 在 文件 fa 中 的 位 置 ( 即 相对 于 文件 起 始 处 的 偏 移 量 )。 
(3) 定义 变量 “Te”， 写 一 段 代 码 ， 从 文件 伺 将 元 素 a[k] 的 内 容 读 入 变量 e。 
哆 ”思考 与 练习 题 4.38 编写 程序 ， 输 入 5 个 学 生 的 成 绩 信 息 ， 包 括 学 号 、 姓 名 、 语 文 、 数 学 、 
英语 ， 成 绩 允 许 有 一 位 小 数 ， 存 入 一 个 结构 体 数 组 ， 该 结构 体 的 定义 为 : 
typedef struct_subject { 
char sno[20]: /| 学 号 
charname[20]: /姓名 
float chinese: // 语 文成 绩 
float math: /数学 成 绩 
float english: /英语 成 绩 
} subject' 
将 学 生 信 息 逐 条 记录 写 入 数据 文件 data， 最 后 读 回 第 1、3、4 条 学 生成 绩 记录 ， 显 示 出 来 ， 检 
查 读 出 结果 是 否 正确 。 
多 * 思 考 与 练习 题 4.39 假设 数组 var 的 元 素 类 型 为 T、 大 小 为 N， 其 定义 为 Tvar[N]。 请 编写 程 
序 ， 将 其 内 容 写 入 文件 data， 要 求 除 最 后 的 write 函数 调用 外 ， 每 次 写 操作 传输 的 字 节 数 为 也。 
寻思 考 与 练习 题 4.40 ”结合 文件 1O 内 核 数 据 结构 ， 说 明 open 和 close 函数 的 执行 过 程 ， 为 何 读 
写 文 件 前 要 打开 文件 ? 
到 ”思考 与 练习 题 4.41 假设 文件 a.txt 的 内 容 是 "abcdefghijklmnopqrstuvwxyz", 文件 b.txt 的 内 容 
是 "0123456789"， 当 前 进程 对 两 个 文件 都 有 读 写 权限 ， 请 写 出 下 列 程序 的 输出 结果 。 
voidmain0 
{ 
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intnewfdoldfdl.oldfd2.newfd2.nchar 
charbuf[30]: 

oldfdl=open("a.txt",O RDWR): 
oldfd2=open("bitxt".O RDWR): 


printfttwThe oldfd1 file descriptor =9%d\n",oldfd1): 
printfttwThe oldfd2 file descriptor =9%d\n",oldfd2): 
newfd=dup(oldfd1): 

Printf("The newfd file descriptor =%d\n",newfd); 


newfd2=dup2(oldfd1.,0); 
Printf("The newfd2 file descriptor =%d\n" ,newfd2); 
nchar=read(0, buf 8): 
buffnchar]f=\0'; 
Printf("I have read from a.txt:%s\n",buf): 
} 


多 思考 与 练习 题 442 阅读 下 面 的 程序 ， 并 按 要 求 回答 问题 。 


intmain0 { 
int fd; 
fd=open("f2.txt".O0_ RDWRIO_CREAT.0621): 
close(fd); 

} 


程序 编译 完 之 后 执行 如 下 指令 ， 请 写 出 文件 亿 .txt 的 权限 。 


Sumask -p 0022 
$. 信 
Sls -1 f2.txt 


线 思考 与 练习 题 443 文件 f31.txt 的 内 容 为 空 ， 文 件 人 3.txt 的 内 容 为 "123456789abcdefg\n", 请 
写 出 下 面 的 程序 p3.c 运行 后 ，f31.txt 文 件 的 内 容 。 


int main| { 
int rbytes,wbytes,fd1 ,fd2: 
char buff10]: 
fd=open("f3.txt", O_RDONLY. 0) 
lseek(fd.-10,SEEK_END): 
rbytes=read(fd1.buf.5): 
buf[5]="\0’; 
fd2=open("f31.txt",O_WRONLY. 0777): 
close(1); 
dup(fd2): 
close(fd2): 
Printf("%s\n", buf): 
close(fd1): 
} 


弛 ”思考 与 练习 题 4.44 ”分析 和 验证 下 列 程序 的 输出 。 


#include <fcntLh> 
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main0 


} 


int fd1fd2,fd3: 
£41 =open("f1".0_RDWR): 

fd2 = open("f2".0_RDWR):; 
printf("fd1=%d\nfd2=%%d\n" fd1 ,£42): 
close(fd1): 

f43 = open("f3".0_RDWR): 
printl("fd3=%d\n" fd3); 

close(fd2): 

close(fd3): 


旨 ” 思考 与 练习 题 445 ”假定 用 户 对 当前 目录 下 存在 的 fl.txt 和 人 .txt 两 个 文件 都 有 读 权限 ， 下 
面 程序 的 输出 是 什么 ? 


intmain0 


{ 


} 


int fdl, fd2; 

fdl = open("fl .txt" , O_ RDDNLY ,0): 
dup(fdl): 

dup2(fd1.6): 

fd2 =open("f2.txt" , O_ RDDNLY , 0): 
printft"fd2 = %dm" , fd2); 

exit(0); 


如 > 思考 与 练习 题 4.46 ”假设 磁盘 文件 ftxt 由 6 个 ASCII 码 字 符 "silent" 组 成 。 写 出 下 列 程序 的 


输出 。 


int main( ) 


{ 


} 


int fd1, fd2; 

char c; 

fd1 = open(ftxt" ,O RDONLY .0); 
fd2 =open(ftxt"O_RDONLY . 0): 
read(fd1 , &c , 1): 

Printft"cl = %e\n" , ©): 

read(fd2 , &c , 1): 

printf("c2 = %c\n" , ©): 

exit(0): 


结 思考 与 练习 题 4.47 假设 文件 test.txt 存在 ， 当 前 用 户 具有 读 写 权 限 ， 请 写 出 下 列 程序 的 输 
出 结果 。 


int mainO{ 


int fd1,fd2,fd3; 

fdl=open("test txt".O_RDWR |O_TRUNC ): 
fd2=dup(fd1): 

printf("fd2=96d\n" fd2): 

close(0): 
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全 3=dup(fal): 
Print “fd3=%dn” 43): 
} 


有 ”思考 与 练习 题 448 下 面 是 一 段 关于 系统 IO 的 程序 ， 请 认真 阅读 并 按 要 求 回答 问题 。 


int main0 { 
int rbytes,wbytes,fd1 ,fd2: 
char buf: 
fdl=open("fla.txt",.O_RDONLY.0): 
fd2=open("f1b.txt",O_WRONLY|O_CREAT.0600): 
while((rbytes=read(fd1,&buf.1))>0) { 
if(buf>="a' && buf<='z') 
buf=toupper(buf); 
wbytes=write(fd2,&bufrbytes): 
本 
close(fdl): 
close(fd2): 
} 
成 功 执行 上 面 的 程序 后 ， 执 行 下 面 两 条 命令 : 


Scat fla.txt 

2016 linux exam GOOD!GOOD! 

Scat flb.txt 

请 给 出 命令 “cat flb.txt” 的 输出 结果 。 
以 = * 思 考 与 练习 题 4.49 为 测量 某 个 函数 func 的 执行 时 间 ,， 通常 可 调用 函数 gettimeofday, 取得 代 
码 段 执行 前 后 的 系统 时 间 右 、 户 ， 如 下 所 示 : 

Mr=gettimeofday(): 

for (i=0; i<N: i++) fonc0: 

M:=gettimeofday(): 

将 二 者 相 减 ， 得 到 代码 段 “for (i=0; i<N: itH func0” 的 测量 时 间 为 My- Mi。 

(1) 请 给 出 fnhncO 函 数 的 测量 时 间 M 的 表达 式 。 

(2) 假设 时 间 测 量 误差 是 小 ， 代 码 段 “for (i=0; i<N; itH):” 的 执行 时 间 为 4,， 不 考虑 多 任务 
切换 带 来 的 影响 ， 请 给 出 func0 函 数 的 真实 执行 时 间 T， 讨 论 如 何 减少 测量 误差 。 
和 ”+* 思 考 与 练习 题 4.50 ”在 Linux 环境 下 , 调用 库 函 数 gettimeofday, 测量 一 个 代码 段 的 执行 时 间 。 
请 写 一 个 程序 ， 测 量 一 次 read 和 一 次 fread 函数 调用 所 需 的 执行 时 间 ， 并 对 测量 结果 给 出 解释 。 提 
示 : 调用 gettimeofdqay 函数 可 获得 微 秒 级 计时 。 
本 = 思考 与 练习 题 4.51 假设 盘 块 大 小 为 512 字 节 ， 计 算 文件 第 10000 字 节 (从 0 开始 计数 ) 所 在 
数据 块 的 逻辑 块 号 。 
寻思 考 与 练习 题 4.52 写 出 Linux 环境 下 ， 获 取 /home/can/hello 文件 的 基本 目录 的 过 程 。 
和 ”思考 与 练习 题 4.53 ”操作 系统 的 文件 管理 模块 有 哪 几 种 提高 文件 搜索 效率 的 措施 ? 
2 * 思 考 与 练习 题 4.54 考虑 读 文 件 系 统 调用 “read(fd, buf len):” 的 实现 。 假 设 当 前 文件 读 写 
指针 的 位 置 为 pos， 逻 辑 数 据 块 和 磁盘 块 大 小 都 是 BSIZE. 

(1) 计算 要 读 入 的 第 一 个 字 节 和 最 后 一 个 字 节 距 文件 起 始 位 置 的 字 节 距离 。 
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(2) 计算 需要 读 几 个 数据 块 ， 给 出 其 逻辑 块 号 的 范围 。 

(3) 假设 已 有 将 文件 世 中 逻辑 块 号 为 n 的 数据 块 读 入 内 存 缓冲 区 rec 的 库 函 数 “int 
ReadLBlock(int fd,int n， void *rec);”， 其 中 返回 值 是 实际 读 出 的 字 节 数 。 请 写 出 函数 “int 
read(fd,void *bufsize t len);” 的 实现 程序 。 

”>* 思 考 与 练习 题 4.55 考虑 写 文件 系统 调用 “write(fd, buf len);”， 假 设 当 前 文件 读 写 指针 的 
位 置 为 pos， 磁 盘 块 大 小 为 BSIZE。 

(1) 计算 要 写 入 的 首 字 节 和 末 字 节 距 文件 起 始 位 置 的 字 节 距离 。 

(2) 计算 要 读 写 几 个 数据 块 ， 给 出 其 逻辑 块 号 的 范围 。 

(3) 假设 将 文件 世 中 块 号 为 n 的 某 个 数据 块 读 入 内 存 缓 冲 区 rec 的 库 函 数 为 “int 
ReadLBlock(int fd,int n, char rec[BSIZE]);”， 其 中 返回 值 是 实际 读 出 的 字 节 数 ; 将 内 存 缓冲 区 rec 
的 内 容 写 入 文件 伺 的 数据 块 n 的 库 函 数 为 “WriteLBlock(int fd,int n, char rec[BSIZE]);”。 请 写 出 
函数 “int write(fd,void *bufsize t len);” 的 实现 程序 。 

多 思考 与 练习 题 4.56 ” 某 磁盘 文件 空间 共有 500 个 磁盘 块 ， 若 用 字 长 为 32 位 的 位 示 图 管理 磁盘 空 
间 ， 试 问 : 

(1) 位 示 图 需要 多 少 个 字 节 ? 

(2) 第 i 字 节 的 第 j 位 对 应 的 块 号 是 多 少 ? 

夷 = 思考 与 练习 题 4.57 车 盘 块 大 小 为 4KB， 块 地 址 用 4 字 节 表示 ， 文件 系统 采用 索引 组 织 方式 ， 
索引 项 0 至 索引 项 9 为 直接 索引 ， 索 引 项 10 为 一 级 间接 索引 ， 索 引 项 11 为 二 级 间接 索引 ， 索 引 项 
12 为 三 级 间接 索引 。 若 文件 索引 节点 已 在 内 存 中 ， 请 计算 读 出 文件 以 下 位 置 处 1500 字 节 数据 ， 需 
要 读 写 多 少 个 磁盘 块 ? 

9000 ©® 180000 @ 4200000 
绪 思考 与 练习 题 4.58 某 计 算 机 系统 采用 如 前 面 图 4-24 所 示 的 位 示 图 ( 行 号 、 列 号 都 从 0 开始 编 
号 ) 来 管理 空闲 盘 块 。 如 果盘 块 从 0 开始 编号 ,每 个 盘 块 的 大 小 为 IKB。 

(1) 现在 要 为 文件 分 配 两 个 盘 块 ， 试 具体 说 明 分 配 过 程 。 

(2) 若 要 释放 磁盘 的 第 1000 盘 块 ， 应 如 何 处 理 ? 

(3) 假设 全 局 数组 变量 short bm[N] 表 示 的 位 示 图 已 读 入 内 存 ， 写 出 返回 一 个 空闲 盘 块 号 的 分 配 
元 数 int alloc0， 以 及 归还 一 个 盘 块 b 的 回收 函数 intrelease(intb) 的 描述 代码 。 
寻思 考 与 练习 题 4.59 假设 磁盘 上 菜系 统 的 逻辑 块 和 物理 块 的 大 小 都 为 4KB, 盘 块 号 用 4 字 节 存 
储 。 假 设 每 个 文件 的 属性 信息 已 经 在 内 存 中 。 针 对 三 种 分 配方 法 (连续 分 配 、 链 接 分 配 和 索引 分 配 )， 
假设 当前 处 在 逻辑 块 10( 最 后 访问 的 是 逻辑 块 10), 现在 想 访问 逻辑 块 4， 那 么 必须 从 磁盘 上 读 多 少 
个 物理 块 ?给 出 原因 。 

好 = 思考 与 练习 题 4.60 某 文 件 系统 的 目录 结构 如 图 4-30 所 示 ， 采 用 一 体 化 目录 ， 每 个 目录 项 占 
256B， 磁 盘 块 大 小 为 512B。 假 设 当前 目录 为 根 目 录 。 

(1) 文件 Wang 的 路 径 是 什么 ? 

(2) 系统 需要 读 取 哪 几 个 目录 文件 后 才能 查 到 文件 Wang? 

(3) 系统 找到 文件 Wang， 至 少 需要 读 几 个 磁盘 块 ? 

(4) 给 出 一 种 加 速 文件 查找 速度 的 目录 结构 。 
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AAA |AAB |AAC | |DDA |DDB | DDC 


Zhang | Wang | Lil Zhao | Liu |... 


don" 


4-30 某 文件 系统 的 目录 结构 


绢 ”思考 与 练习 题 4.61 考虑 一 个 含有 100 个 数据 块 的 文件 。 假 如 文件 控制 块 (和 索引 块 ， 当 用 索 
引 分 配 时 ) 已 经 在 内 存 中 ， 逻 辑 块 与 物理 块 大 小 相同 。 当 使 用 连续 、 链 接 、 单 级 索引 分 配 策略 时 ， 下 
列 操作 各 需要 多 少 次 磁盘 IO 操作 ? 假设 在 连续 分 配 时 ， 在 开始 部 分 没有 扩张 空间 ， 但 在 结尾 部 分 
有 扩张 空间 ， 并 且 假 设 待 添加 块 的 信息 已 在 内 存 中 。 

(1) 在 开头 增加 一 块 。 (2) 在 中 间 增 加 一 块 。 (3) 在 末端 增加 一 块 。 

(4) 在 开头 删除 一 块 。 (5) 在 中 间 删 除 一 块 。 (6) 在 末端 删除 一 块 。 
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第 5 章 


进程 管理 与 控制 


支持 多 进程 (或 多 任务 ) 并 发 是 计算 机 系统 实现 强大 处 理 功能 的 基础 。 正 是 基于 操作 系统 的 多 进 
程 (多 任务 ) 管 理 能 力 ， 才 使 我 们 能 够 很 好 地 驾驭 并 发 活动 的 复杂 管理 ， 开 发 出 各 种 功能 强大 的 信息 
管理 系统 、 网 络 应 用 、 购 物 平 台 ， 并 充分 发 挥 计算 机 硬件 系统 强大 的 处 理 能 力 ， 满 足 各 种 应 用 对 性 
能 的 需求 ， 如 实时 信息 查询 、 网 络 购物 等 。Linux 是 优秀 的 多 任务 操作 系统 ， 人 允许 系统 中 同时 运行 
多 个 进程 、 线 程 ， 通 过 多 任务 并 发 ， 实 现 强大 的 系统 功能 ， 使 其 在 科学 计算 、 数 据 处 理 、 网 络 通信 、 
办 公 娱 乐 等 很 多 方面 得 到 广泛 的 应 用 。 本 章 讲述 进程 的 概念 、 多 进程 并 发 和 进程 管理 机 制 ， 学 习 多 
进程 并 发 程序 设计 ， 为 未 来 解决 实际 应 用 中 的 并 发 问题 ， 以 及 学 习 分 布 式 编程 、 大 数据 处 理 、 云 计 
算 、 嵌 入 式 应 用 开发 等 技术 打下 基础 。 


本 章 学 习 目 标 : 

理解 逻辑 控制 流 、 并 发 流 的 基本 概念 ， 理 解 进程 概念 、 结 构 与 描述 

理解 进程 的 基本 状态 及 状态 转换 关系 图 ， 了 解 进程 PCB 组织， 分 辨 进程 与 程序 的 区 别 与 联系 
掌握 利用 进程 创建 、 程 序 加 载 、 进 程 终 止 、 进 程 撤销 进行 多 进程 并 发 编程 的 基本 方法 
理解 多 进程 并 发 执行 特征 ， 掌 握 程序 并 发 运行 的 基本 分 析 方 法 

理解 信号 机 制 与 应 用 ， 人 掌握 利 用 信号 机 制 进行 编程 的 基本 框架 

理解 守护 进程 的 概念 ， 了 解 应 用 编程 方法 


逻辑 控制 流 和 并 发 流 


在 多 进程 运行 环境 下 ， 系 统 通过 进程 技术 给 每 个 程序 造成 一 种 假象 :好像 它 在 独占 地 使 用 处 理 
器 。 如 果 用 gdb 单 步 执行 程序 ， 我 们 会 看 到 一 系列 的 程序 计数 器 (PC) 值 ， 这 些 值 对 应 程序 的 各 条 二 
进 制 指令 ， 或 对 应 动态 库 中 共享 对 象 中 的 指令 ， 按 照 程序 执行 流程 运行 或 跳 转 。 这 个 PC 值 的 序列 
叫 作 逻 辑 控制 流 ， 或 者 简称 逻辑 流 。 

考虑 一 个 运行 三 个 进程 的 系统 ， 如 图 5-1 所 示 。 处 理 器 的 一 个 物理 控制 流 分 成 三 个 逻辑 流 ， 每 
个 进程 一 个 逻辑 流 。 每 条 坚 线 表 示 一 个 进程 逻辑 流 的 一 部 分 。 在 这 个 例子 中 ， 三 个 逻辑 流 的 执行 是 
交错 的 。 进 程 A 运行 了 一 会 儿 ， 然 后 进程 B 开始 运行 ， 直 到 完成 。 随 后 ， 进 程 C 运行 了 一 会 儿 


进程 A 接着 运行 , 直到 完成 。 最后, 进程 C 可 以 运行 到 结束 了 。 这 表明 多 个 进程 在 轮流 使 用 处 理 器 ， 
每 个 进程 执行 其 逻辑 流 的 一 部 分 ， 然 后 被 抢占 (preempted) 并 暂时 挂 起 ， 轮 到 其 他 进程 执行 。 但 对 于 
一 个 运行 在 进程 上 下 文中 的 程序 来 说 ， 看 上 去 好 像 在 以 独占 方式 使 用 处 理 器 。 
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图 5-1 逻辑 控制 流 。 进 程 为 每 个 程序 提供 了 一 种 假象 ， 好 像 程序 在 独占 地 使 用 处 理 器 。 
每 条 竖 线 表示 一 个 进程 的 逻辑 控制 流 的 一 部 分 

CPU 在 不 同 进程 间 转 移 的 原因 可 归 为 两 类 : 一 类 是 进程 主动 放弃 CPU， 如 进程 执行 耗 时 的 VO 
操作 时 (比如 执行 C 语言 的 scanf 语句 )，CPU 无 事 可 做 ， 进 程 主动 放弃 CPU; 另 一 类 是 进程 被 动 放 
弃 CPU， 比 如 本 次 分 配给 进程 的 时 间 配 额 已 经 用 完 ， 或 有 紧迫 程度 更 高 的 任务 需要 执行 ， 操 作 系 统 
强行 夺 走 CPU， 并 分 派 给 其 他 进程 。 CPU 控制 发 生 转 移 的 时 机 一 般 都 在 中 断 响应 之 时 ， 因 为 只 有 在 
这 个 节 骨 眼 操作 系统 能 介入 控制 。 一 旦 有 中 断 发 生 , CPU 执行 完 手头 指令 就 会 去 响应 中 断 ， 而 中 断 ， 
尤其 是 时 钟 中 断 可 在 任何 时 候 发 生 。 因 此 ， 在 每 条 指令 执行 后 都 可 能 发 生 CPU 控制 易 主 。 

计算 机 系统 中 的 逻辑 流 有 许多 不 同 的 形式 。 进 程 、 中 断 (异常 ) 处 理 程序 、 信 号 处 理 程序 、 线 程 
和 Java 进程 都 是 逻辑 流 的 例子 。 

对 于 执行 在 时 间 上 有 重 又 的 逻辑 流 ， 称 为 并 发 流 (concurrent flow)， 并 发 流 是 并 发 运行 的 。 也 就 
是 说 , 流 久 和 YY 互相 并 发 ， 当 且 仅 当 义 在 Y 开始 之 后 和 YY 结束 之 前 开始 ， 或 者 Y 在 义 开始 之 后 
和 和 结束 之 前 开始 。 例 如 ， 在 图 5-1 中 ， 进 程 A 和 B 并 发 地 运行 ,进程 A 和 C 也 一 样 。 但 进程 B 
和 C 没有 并 发 地 运行 ， 因 为 进程 B 在 C 开始 前 已 经 结束 。 

由 于 中 断 频 度 、 负 载 大 小 的 影响 , 两 个 逻辑 流 在 两 次 不 同 的 执行 过 程 中 可 能 有 不 同 的 重 登 模式 ， 
甚至 还 存在 时 间 不 重合 的 情况 。 这 时 我 们 的 判断 准则 是 ， 只 要 某 种 可 能 的 执行 模式 在 时 间 上 存在 重 
县 ， 它 们 就 是 并 发 流 。 

多 个 流 并 发 执行 的 一 般 现象 称 为 并 发 (concurrency)。 一 个 进程 和 其 他 进程 轮流 运行 的 概念 称 为 
多 任务 (multitasking)。 每 次 分 配给 一 个 进程 的 执行 时 间 称 为 时 间 片 (ime slice)。 进 程 也 因此 划分 为 多 
个 时 间 分 片 (time slicing)。 例 如 ， 在 图 5-1 中 ， 进 程 A 的 逻辑 流 由 两 个 时 间 分 片 组 成 。 

并 发 的 思想 与 流 运行 的 处 理 器 核 数 或 CPU 数 无 关 。 如果 两 个 流 在 时 间 上 重合 , 那么 它们 就 是 并 
发 的 ， 即 使 它们 运行 在 同一 个 处 理 器 上 。 如 果 两 个 流 同 一 时 刻 运行 在 不 同 的 处 理 器 核 或 计算 机 上 ， 
那么 称 它们 为 并 行 流 (parallel flow)。 并 行 流 在 某 段 时 间 内 同时 执行 ， 是 并 发 流 的 一 个 真子 集 。 

刚才 讲 到 的 并 发 流 、 并 行 流 等 概念 ， 是 在 逻辑 流 已 经 完成 执行 的 条 件 下 ， 对 其 并 发 、 并 行 特性 
做 出 的 判定 。 但 在 实际 应 用 中 ， 我 们 要 求 程序 还 未 执行 ， 就 要 对 其 并 发 、 并 行 特性 做 出 分 析 。 一 般 
来 说 ， 两 个 逻辑 流 的 操作 指令 有 很 多 种 不 同 的 交叉 或 非 交叉 执行 顺序 ， 只 要 有 一 种 可 能 顺序 是 并 发 
的 ， 就 称 这 两 个 流 是 并 发 的 ， 只 要 有 一 种 顺序 在 多 处 理 器 环境 下 是 并 行 的 ， 就 称 两 个 流 是 并 行 的 。 
虽然 并 行 流 是 并 发 流 的 子 集 ， 而 且 很 多 场景 下 并 发 程序 也 是 可 并 行 的 ， 但 在 实际 应 用 中 ， 我 们 一 般 
只 需要 知道 一 个 程序 是 否 是 并 发 的 。 
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5 思考 与 练习 题 5.1 考虑 三 个 具有 下 述 起 始 和 结束 时 间 的 进程: 


进程 起 始 时 间 结束 时 间 
站 0 元 
B 1 4 


3 1 


C 
对 于 每 对 进程 ， 指 出 它们 是 否 是 并 发 运行 的 。 


(DAB (WAC (3)BC 
进程 的 基本 概念 


不 严格 地 说 ， 进 程 是 正在 执行 的 程序 ， 更 严格 一 点 说 ， 进 程 是 程序 在 一 个 独立 数据 集 上 执行 的 
过 程 ,我 们 打开 一 个 Linux 终端 窗口 ,实际 上 就 是 创建 一 个 bash 进程 ; 当 在 Linux 终端 输入 一 条 Linux 
命令 时 ，Linux 也 创建 一 个 进程 来 执行 该 程序 ; 而 键入 一 个 Shell 脚本 时 ， 则 创建 一 个 bash 进程 来 执 
行 该 脚本 。Linux 命令 、 程 序 、 脚 本 执行 完毕 时 ， 这 个 进程 就 被 终止 了 。 

作为 多 用 户 系统 ，Linux 允许 多 个 用 户 同时 登录 系统 。 每 个 用 户 可 以 同时 运行 多 个 程序 ， 或 者 
同时 运行 同一 个 程序 的 多 个 运行 实例 ， 每 个 程序 运行 实例 都 是 一 个 进程 ， 系 统 本 身 也 运行 着 一 些 管 
理 系统 资源 和 控制 用 户 访问 的 程序 。 


5.2.1 进程 概念 、 结 构 与 描述 


作为 程序 执行 过 程 的 进程 , 至 少 要 包含 三 项 内 容 : 程序 代码 、 数据 集 和 进程 控制 块 (PCB, Process 
Control Block)， 如 图 5-2 所 示 。 进 程 是 程序 的 执行 过 程 ， 首 先 必须 有 程序 代码 ， 一 般 是 包括 main 函 
数 的 可 执行 程序 ， 将 程序 装载 到 内 存 中 ， 进 程 才能 启动 ， 数据 集 是 进程 的 处 理 对 象 ， 可 认为 是 变量 
内 容 ， 保 存 初始 化 信息 、 环 境 变量 、 命 令 行 参数 和 文件 数据 ， 为 了 对 进程 实施 管理 ，Linux 系统 需 
要 找到 进程 的 程序 代码 、 数 据 变量 所 在 存储 器 地 址 ， 有 时 还 需要 查阅 进程 的 其 他 属性 。 因 此 ，Linux 
系统 为 每 个 进程 创建 了 一 个 称 为 进程 控制 块 (CCB) 的 结构 体 ， 用 于 管理 各 种 进程 属性 。 有 进程 就 有 
PCB, 找到 PCB 就 能 找到 进程 各 种 信息 , PCB 是 进程 存在 的 唯一 标志 ,以 后 操作 系统 就 可 通过 PCB 
来 对 进程 实施 管理 和 控制 。 


一 一 程序 代码 


| CPU 现场 信息 | 。 一 一 | 数据 集 
图 5-2 进程 的 结构 
进程 有 很 多 属性 ， 为 便于 理解 ， 可 划分 为 四 类 。 
(1) 进程 描述 信息 
通过 进程 描述 信息 ，Linux 系统 可 以 唯一 地 确定 某 个 进程 的 基本 情况 ， 了 解 该 进程 所 属 的 用 户 
及 用 户 组 等 信息 ， 同 时 还 能 确定 这 个 进程 与 所 有 其 他 进程 之 间 的 关系 。 这 些 描述 信息 包括 : 进程 号 、 
用 户 和 组 标识 以 及 进程 族 亲 信息 。 
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人 进程 号 (PID，process identifier): Linux 系统 为 每 个 进程 分 配 唯一 的 标识 号 ， 通 过 这 个 标识 号 
搜索 、 控 制 、 调 度 该 进程 ， 别 的 进程 也 通过 这 个 标识 号 来 识别 这 个 进程 并 与 之 通信 ， 用 户 也 通过 标 
识 号 来 使 用 操作 命令 或 系统 调用 控制 该 进程 。 一 个 程序 运行 两 次 ， 会 产生 两 个 运行 实例 ， 每 个 程序 
运行 实例 是 一 个 不 同 的 进程 。 

@ 用 户 和 组 标识 (user and group identifier): Linux 系统 中 有 四 类 不 同 的 用 户 和 组 标识 ， 主 要 用 
来 控制 进程 对 系统 文件 的 访问 权限 ， 实 现 对 系统 资源 的 安全 访问 。 

@ 族 亲 信息 : Linux 系统 中 的 进程 之 间 形 成 树 状 的 家 族 关系 ， 族 亲信 息 包括 某 个 进程 的 父 进 
程 、 兄 弟 进程 (具有 相同 父 进程 的 进程 ) 以 及 子 进程 是 谁 ， 描 述 一 个 进程 在 整个 家 族 中 的 具体 位 置 。 

(2) 进程 控制 信息 

进程 控制 信息 记录 进程 的 当前 状态 、 调 度 信息 、 计 时 信息 以 及 进程 间 通 信 信 息 ， 是 系统 掌握 进 
程 状态 、 了 解 进程 间 关系 、 实 施 进程 调度 的 主要 依据 。 

Q@ 进程 状态 : 进程 在 其 生命 周期 中 ,总 是 不 停 地 在 各 种 状态 之 间 转 换 ， 有关 进程 的 状态 及 转换 
规则 ， 在 下 一 小 节 讨 论 。 

@) 调度 信息 : 系统 的 调度 程序 利用 这 部 分 信息 决定 哪个 进程 应 该 运行 , 包括 优先 级 、 剩余 时 间 
片 和 调度 策略 等 。 

@ 计时 信息 : 包括 时 间 片 和 定时 器 , 给 出 进程 占有 和 利用 CPU 的 情况 ,是 处 理 器 调度 的 依据 ， 
也 是 进行 统计 、 分 析 以 及 计 费 的 依据 。 

@ 通信 信息 : 多 个 进程 之 间 通 信 的 各 种 信息 也 记录 在 PCB 中 。Linux 支持 典型 的 UNIX 进程 
间 通 信 机 制 一 信号 、 管 道 ， 也 支持 System VIPC 通信 机 制 一 共享 内 存 、 信 号 量 和 消息 队列 。 

(3) 进程 资源 信息 

Linux 的 PCB 中 包含 大 量 的 系统 资源 信息 ,这 些 信息 记录 与 该 进程 有 关 的 存储 器 的 地 址 和 资料 、 
文件 系统 以 及 打开 文件 的 信息 等 。 通过 这 些 资料 , 进程 就 可 以 得 到 运行 所 需 的 相关 程序 代码 和 数据 。 

(4) CPU 现场 信息 

进程 的 静态 描述 必须 保证 一 个 进程 在 获得 处 理 机 并 重新 进入 运行 状态 时 ， 能 够 精确 地 接着 上 次 
运行 的 位 置 继续 运行 。 相 关 程 序 段 和 数据 集 以 及 处 理 机 现场 (或 处 理 机 状态 ) 都 必须 保存 处理 机 (CPU) 
现场 信息 一 般 包括 CPU 内 部 寄存 器 和 堆栈 等 基本 数据 。 

task-struct( 任 务 结构 体 ) 是 Linux 系统 的 进程 控制 块 (PCB)， 通 过 对 PCB 进行 操作 ， 系 统 为 进程 
分 配 资源 并 进行 调度 ， 最 终 完成 进程 的 创建 和 撤销 。 系 统 利用 PCB 中 的 描述 信息 来 标识 一 个 进程 ， 
根据 PCB 中 的 调度 信息 决定 该 进程 是 否 应 该 运行 。 如 果 这 个 进程 要 进入 运行 状态 , 首先 根据 其 中 的 
CPU 现场 信息 来 恢复 运行 现场 ， 然 后 根据 资源 信息 获取 对 应 的 程序 段 和 数据 集 ， 接 着 上 次 的 位 置 继 
续 执行 ， 并 通过 PCB 中 的 通信 信息 和 其 他 进程 协同 工作 。 下 面 给 出 了 task_struct 结构 体 的 部 分 重要 
属性 : 


pid t pid: 上 # 进程 识别 码 */ 
id tuideuidsuid fsuid; 上 # 用 户 标识 码 *#/ 
gidt gidegidsgidfsgid: 入 用 户 组 标识 码 *#/ 描述 信息 


struct task_struct *p_opptr, *p_pptr. *p_cptr. 
*p_ysptr, *p_osptr: 庆 父子 兄弟 进程 指针 */ 
struct task_stmuct *prev_task. +next task 
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雍 进程 队列 指针 */ 
volatile long state: 上 # 进程 状态 */ 
long counter: 片 剩余 时 间 片 所 a 
oi 刻 优 先 级 de 
unsigned long policy. rt_priority; 
片 调度 策略 ， 实 时 优先 级 */ 
struct mm_struct  *mm: 上 # 存储 器 资源 */ 
struct fs stmct *fs; 片 打开 文件 资源 */ 资源 信息 


在 以 上 结构 体 中 ，p_opptr、p_pptr、p_cptr、p_yspttr、p_osptr 分 别 是 指向 祖先 进程 、 父 进程 、 子 进 
程 、 弟 进程 、 兄 进程 的 指针 ， 用 于 创建 进程 间 族 亲 关 系 树 。prev_task、*next_task 则 用 于 创建 双向 进程 
队列 ，Linux 系统 一 般 要 创建 两 种 进程 队列 ， 分 别 是 就 绪 队 列 和 阻塞 队列 。 


5.2.2 ”进程 的 基本 状态 及 状态 转换 


为 了 对 进程 实施 管理 控制 , 一 般 根据 CPU 对 资源 的 拥有 情况 , 为 处 于 生命 周期 中 的 进程 定义 三 
种 基本 状态 : 

@ 就 绪 状 态 (ready)。 指 进程 已 分 配 到 除 CPU 外 的 所 有 必要 资源 ， 只 要 获得 CPU， 便 可 立即 执 
行 。 处 于 就 绪 状态 的 进程 ， 一 般 获 得 所 需 的 存储 器 、IO 设备 、 文 件 和 其 他 资源 ， 不 等 待 事件 发 生 ， 
只 要 获得 CPU， 就 可 投入 运行 。 通 常 新 创建 的 进程 处 于 就 绪 状态 。 

@ 运行 状态 (unning， 也 称 执行 状态 )。 指 进程 已 获得 CPU, 程序 正在 执行 。 处 于 运行 状态 的 进 
程 ， 已 获得 所 需 内 存 、IO 设备 、 文 件 和 其 他 资源 ， 并 且 也 获得 CPU。 当 就 绪 状态 的 进程 被 进程 调 
度 器 选中 ， 将 CPU 分 配给 其 使 用 时 ， 进 程 将 从 就 绪 状态 转换 到 运行 状态 。 

@ 阻塞 状态 (waiting)。 正 在 执行 的 进程 因 请 求 资源 、 等 待 事件 发 生 、 等 待 VO 等 原因 ， 而 暂时 
无 法 继续 执行 时 ， 进 入 阻塞 状态 。 进 入 阻塞 状态 的 进程 会 主动 放弃 CPU， 供 其 他 进程 使 用 。 

在 实际 操作 系统 设计 中 ， 为 更 好 地 描述 进程 从 诞生 到 消亡 过 程 的 状态 变化 ， 往 往 还 需要 增加 两 
个 状态 : 

@ 创建 状态 aew): 正在 创建 且 尚 未 完成 创建 过 程 的 进程 所 处 的 状态 称 为 创建 状态 。 创 建 一 个 
进程 一 般 要 通过 多 个 步骤 才能 完成 ， 在 创建 过 程 中 ， 虽 然 进程 已 经 存在 ， 但 还 不 能 调度 运行 ， 引 入 
创建 状态 ， 可 防止 系统 调度 “尚未 足 月 ”的 进程 运行 。 

@ 终止 状态 (terminated): 进程 终止 后 并 不 立即 清理 ， 而 是 让 其 进入 终止 状态 。 进 程 终止 的 原因 
一 般 有 正常 结束 、 出 错 终结 、 被 杀 死 等 。 处 于 终止 状态 的 进程 永远 不 会 再 被 执行 。 设 置 终止 状态 允 
许 操作 系统 获取 其 终止 原因 和 统计 数据 ， 最 后 将 其 清理 。 

5-3 展示 了 进程 的 五 种 状态 及 状态 转换 关系 。 


(创建 ) 


图 5-3 进程 状态 及 状态 转换 
思考 与 练习 题 5.2 图 5-3 中 有 几 种 进程 状态 转换 关系 , 什么 原因 会 导致 图 5-3 中 进程 状态 的 转 
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换 ? 为 何 没 有 从 阻塞 到 运行 、 从 就 绪 到 阻塞 的 转换 ? 
虽 ” 思考 与 练习 题 5.3 参看 图 5-3， 请 问 scanf、fork、read、write、exit、wait、sleep、pause 等 
函数 可 能 导致 调用 进程 发 生 何 种 状态 变化 ， 可 能 导致 其 他 进程 发 生 何 种 状态 变化 ， 为 什么 ? 


5.2.3 ”对 进程 PCB 进行 组 织 


一 个 系统 内 通常 有 很 多 进程 ， 需 要 对 进程 PCB 进行 有 效 组 织 ， 以 方便 进程 管理 。Linux 系统 以 
双向 链表 、 树 型 链表 等 多 种 形式 进行 组 织 ， 人 允许 系统 按 不 同方 式 快速 检索 进程 的 PCB。 

(1) 双向 链表 队列 

Linux 系统 一 般 根 据 进程 状态 将 进程 PCB 组 织 成 多 个 双向 链表 ， 每 个 双向 链表 都 是 一 个 进程 队 
列 ， 这样 组 织 便于 快速 获得 队列 中 的 第 一 个 进程 。Linux 用 prev_task 和 next task 两 个 指针 来 构建 进 
程 队列 。 可 设置 一 个 就 绪 队 列 和 多 个 阻塞 队列 。 处 于 就 绪 状 态 的 进程 都 插入 就 绪 队 列 ， 为 每 种 等 待 
事件 设置 一 个 阻塞 队列 ,将 处 于 阻塞 状态 的 进程 插入 到 等 待 事件 相关 的 阻塞 队列 中 , 如 图 5-4 所 示 。 


时 间 片 用 完 


[TT meme LT 


创建 进程 


进程 调度 


事件 1 出 现 等 待 事件 1 


事件 2 出 现 等 待 事件 2 


等 待 事件 n 


事件 n 出 现 


阻 | 塞 | 队 | 列 
图 5-4 根据 进程 状态 ， 利 用 双向 链表 将 进程 PCB 组 织 成 多 个 队列 


(2) 双向 链表 + 树 型 结构 : 按 进 程 间 族 亲 关系 组 成 双向 链表 + 树 型 结构 ， 树 型 结构 展示 父子 关系 ， 
父 节 点 为 父 进程 ， 链 表 结 构 表达 兄弟 关系 。 父 子 进程 间 通过 p_pptr、p_cptr 两 个 指针 联系 ， 兄 弟 进 
程 间 通 过 p_osptr 和 p_ysptr 两 个 指针 联系 ， 父 进程 的 p_cptr 指向 第 一 个 子 进程 。 这 种 组 织 方式 便于 
根据 PID 迅速 找到 父 进 程 、 子 进程 、 兄 弟 进 程 PCB， 如 图 5-5 所 示 。 
条 ”* 思 考 与 练习 题 5.4 ”假设 ready 是 Linux 系 统 就 绪 队列 指针 ， 就 绪 队 列 中 的 进程 通过 指针 prev_task 和 
Dext task 构 成 双向 队列 ， 假 设 某 个 进程 task_stmuct 结 构 的 指针 是 p 请 给 出 将 其 插入 就 绪 队 列 末尾 的 代码 。 
旨 * 思 考 与 练习 题 5.5 ”假设 某 个 进程 task_struct 结构 的 指针 是 pp， 其 新 创建 子 进程 task_struct 结 
构 的 指针 是 p， 请 写 出 将 进程 p 插入 图 5-5 所 示 进 程 族 亲 关系 树 的 代码 。 


P_pptr 父 进程 指针 
定 
一 .六 Pt 及 进入 指针 (第 1 个 ) 


5-5 ”进程 间 族 亲 关 系 树 
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5.2.4 ”进程 实例 


我 们 通过 多 次 运行 整数 排序 程序 prol.c 来 说 明 多 进程 的 概念 ， 以 下 是 源 程序 代码 ; 
#include <stdio.h> int sort(int a[], int n) 
int sort(int a[],int n): 本 
intmain0 intijt 
{ for (i=0: i<9: +) 
int a[10]: forG=it+1:; j<10; j++) 
inti; { 
printft" 请 输入 10 个 整数 : "); 这 a[i]>aD]) 
for (i=0; i<10; i++) scanfl"%%d",&zali]): { 
sort(a.10): t=ali]:ali]=alj]:ali]=t 
for (i=0: i<10:; i++) printf("%6d "ali]): } 
printft"n' } 


} a 


先 编译 该 程序 ， 再 在 两 个 不 同 的 终端 窗口 中 执行 程序 ， 在 另 一 个 终端 窗口 中 显示 进程 信息 。 


Sgce -0 procl procl.c 


两 个 程序 启动 后 ， 都 在 等 待 用 户 输 入 数据 ， 在 下 方 打开 第 三 个 终端 窗口 ， 输 入 以 下 命令 ， 查 看 
有 几 个 名 为 procl 的 进程 

Sps -eflgrep procl 

结果 有 三 行 ， 前 两 行 就 是 上 面 在 两 个 终端 窗口 中 运行 程序 ./procl 产生 的 进程 ， 第 三 行 过 滤 进 程 


信息 的 grep 命令 产生 的 进程 ， 表 明 系 统 确实 产生 了 两 个 进程 ， 如 图 5-6 所 示 。 


Terminal 


can@ubuntu: ~ 
can 4 


图 5-6 一 个 程序 运行 多 次 后 产生 多 个 进程 的 场景 


在 两 个 名 为 ./procl 的 进程 中 ， 它 们 的 程序 代码 都 是 可 执行 程序 ./proc1， 数 据 集 就 是 从 键盘 输入 
的 待 排 序数 据 ， 两 个 进程 的 数据 集 是 不 同 的 ，ps 命令 给 出 的 结果 就 是 保存 在 PCB 中 的 进程 属性 信 
息 。 在 该 例 中 ， 显 示 的 信息 可 解释 为 : can 是 启动 进程 的 用 户 名 ; 4376、4380 分 别 是 两 个 ./procl 进 


程 的 PID; 3771 和 4307 分 别 是 各 自 父 进程 的 PID， 在 这 吓 


有 是 对 应 终端 窗口 Shell 进程 的 PID; pts/0、 


pts/24 分 别 是 两 个 进程 所 在 终端 窗口 的 设备 名 ;最 后 两 个 字段 是 进程 的 运行 时 间 和 进程 名 称 ， 进 程 


名 称 一 般 是 可 执行 文件 路 径 。 


在 上 面 两 个 终端 窗口 中 输入 完 数据 并 按 回 车 后 ， 两 个 程序 执行 完毕 , 重新 显示 命令 提示 符 $, 再 
查看 名 为 /procl 的 进程 信息 ， 发 现 两 个 进程 不 见 了 ， 表 明 程序 运行 结束 ， 进 程 消亡 了 。 


Ee 
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3 拓 思考 与 练习 题 56 在 以 下 启动 Windows 环境 的 搜狗 浏览 器 中 打开 两 个 网 页 ， 同 时 启动 
winword 编辑 一 个 文件 ， 如 图 5-7 所 示 。 请 问 这 里 有 几 个 进程 ， 这 些 进程 各 自 的 程序 和 数据 是 
什么 。 


不 可 同 ， 一 个 过程 所 执行 的 任何 活动 不 会 影响 其 他 进程 的 交 量 仁 》 
并 发 多 性: 务 进香 并 发 执 行 .在 单 处 理 各 取 统 上 各 流 合用 CPU 向 前 推 
am 上 ， eT 
以 下 是 2 个 IExplersr 浏览 回 进 程 与 一 个 Winworg 进程 的 执行 界面 . 

三 个 进程 的 构成 。 
3 WR 


让 1 个 三 xplorer 漠 览 器 进程 ， 程 序 是 IExplorerexe， 数 据 balgy 首页 ， 


5-7 打开 两 个 网 页 


5.2.5 “操作 进程 的 工具 


Linux 进程 列表 把 当前 加 载 到 内 存 中 的 所 有 进程 的 有 关 信 息 保存 在 一 个 表 中 ， 其 中 包括 进程 的 
PID、 进 程 状态 、 命 令 字符 串 和 其 他 各 类 进程 信息 。 进 程 表 中 的 每 一 行 实际 上 是 一 个 进程 的 进程 控 
制 块 PCB) 中 的 信息 ， 操 作 系统 通过 进程 的 PID 对 它们 进行 管理 ， 这 些 PID 是 进程 表 的 索引 。 

Linux 环境 下 的 进程 管理 工具 很 多 ， 一 般 用 ps 命令 显示 进程 列表 ， 用 kill 命令 终止 指定 PID 的 
进程 。 此 外 ， 还 可 用 top 命令 按 活跃 度 顺序 显示 进程 列表 ， 用 pstree 命令 根据 进程 族 亲 关系 以 树 型 
结构 显示 系统 中 所 有 进程 的 名 称 。 在 Windows 环境 下 一 般 可 用 任务 管理 器 查看 进程 信息 。 

本 节 仅 介绍 最 常 使 用 的 ps、kill 两 个 命令 和 后 台 执行 命令 的 基本 用 法 。 


1. 用 ps 命令 查看 进程 信息 


Linux 系统 下 用 ps 命令 查看 进程 列表 。ps 命令 的 选项 很 多 ， 不 同 选项 显示 的 进程 信息 不 同 ， 进 
程 类 别 也 不 同 。 
Ps -ef 格式 应 用 广泛 ， 用 于 查看 系统 中 所 有 进程 信息 ， 包 括 系 统 进 程 和 用 户 进程 ， 下 面 是 示例 : 


Sps -ef 

UD PD PPD CSTIMETIY TIME CMD 

root 1 0 ODecl1? 00:00:01 /sbin/init 
root 2 0 0Decl1? 00:00:00 [kthreadd] 
root 3 2 0Decl1? 00:00:01 [ksoftirqd/0] 
root 4 2 0Decl1? 00:00:00 [migration/0] 
can 2039 1 0Decll? 00:00:20 gedit test.c 


前 三 列 的 含义 依次 为 用 户 名 UID、 进 程 PID、 父 进程 PPID， 后 两 列 分 别 为 运行 时 间 TIME 和 进 
程 启动 命令 CMD。 

由 于 ps 命令 的 输出 行 太 多 ， 一 般 利 用 管道 机 制 ， 将 输出 送 给 grep 命令 以 过 滤 找 到 所 需 的 进程 
信息 。 比 如 要 查看 系统 中 所 有 bash 进程 每 个 bash 进程 就 是 一 个 命令 窗 口 ) 的 信息 ,就 可 将 命令 ps -ef 
的 输出 通过 用 符号 | 表示 的 管道 传 给 grep 命令 进行 过 滤 ， 仅 输出 包含 字符 串 bash 的 输出 行 : 
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Sps -eflgrep bash 
can 2016 2012 0Decll pts/0 00:00:00 bash 
can 2854 2012 0Decl3pts/l 00:00:00 bash 
can 2875 2012 0Decl3pts/2 00:00:00 bash 
can 3131 2875 008:57pts/2 00:00:00 grep —color=auto bash 


命令 输出 表明 : 当前 用 户 打 开 了 三 个 终端 窗口 ， 对 应 的 设备 名 分 别 为 pts/0、pts/1、pts/2， 进 程 


PID 分 别 为 2016、2854、2875， 父 进程 都 是 2012。 
8 思考 与 练习 题 5.7 写 出 查看 init 进程 信息 的 命令 , 根据 显示 结果 写 出 其 UID、PID、PPID。 


由 于 进程 数 太 多 ， 可 用 命令 选项 限定 仅 显 示 当前 用 户 所 属 进程 。 使 用 ps 1 命令 显示 当前 用 户 


所 拥有 进程 的 进程 信息 ， 图 5-8 显示 了 命令 格式 及 输出 中 各 信息 列 的 含义 。 


Sooooom 


进程 标识 进程 优先 级 进程 状态 进程 程序 代码 
用 户 人 D 号 | | 进程 启动 终端 已 用 CpU 时 间 | 
ps 上 + 
UID PID PPID PRI NI VSz RSS RCHAN STAT TTY T COMDIAND 
1002 2032 2028 20 0 ?7152 3824 n_tty_ Sas+ pts/0 0:01 bash 
1002 2055 2032 20 0 182084 71028 poll_s SI pts/0 1:44 gedit 7-2-1 
1002 2119 2028 20 0 7152 3816 wait Ss pts/l 0:01 bash 
1002 4598 2028 20 0 7152 3812 ntty_ Sst+ pts/2 0:00 bash 
1002 31264 2028 20 0 7152 3816 n_tty_ Ss+ pts/3 0:00 bash 
1002 31348 2119 20 0 4372 676 - R+ pts/l 0:00 ps 1 


图 5-8 ps 1 命令 的 输出 及 各 列 解释 
用 ps -u 命令 显示 当前 用 户 所 拥有 进程 的 资源 消耗 信息 ， 如 图 5-9 所 示 。 


0 PID %CPU %MEM Vsz Rss TTY STAT START TIME COMAND 
can 5874 0.1 1.1 5784 2996 pts/0 Ss 16:26 0:00 bash 
can 5896 0.3 1.1 5840 3056 pts/1] Ss 16:26 0:00 bash 
can 5913 5.6 7.6 53044 19588 pts/1 S+ 16:26 0:00 gedit hl.c¢ 
? + 0.0 f 2648 1028 pts/0 = R+ 16:26 0:00 ps u 
用 户 名 进程 标识 符 | 进程 状态 启动 时 间 加 到 
CPU 占用 时 占用 CPU 
间 百 分 比 时 间 
图 5-9 psu 命 令 的 输出 及 各 列 解释 
以 下 解释 输出 中 各 列 的 含义 。 
e UID: 启动 该 进程 的 用 户 ID， 进 程 对 文件 等 资源 是 否 有 某 种 访问 权限 ， 通 常 取决 于 具有 该 
UID 的 用 户 是 否 有 某 种 权限 。 
e PID: 进程 的 唯一 人 D 号 。 
e 了 PPID: ParentPID， 父 进程 的 ID 号 。 
e 了 PRI: 进程 优先 级 ， 进 程 优先 级 越 高 ， 竞 争 CPU 的 能 力 越 强 。 
e@ ”STAT: 进程 状态 ， 指 当前 进程 是 否 正在 执行 ， 或 处 于 等 待 CPU 就 绪 状态 ， 或 处 于 竞争 资 


源 访问 状态 。 
e TTY: 进程 是 在 哪个 终端 窗口 中 启动 的 。 
e COMMAND: 进程 是 通过 启动 哪个 命令 产生 的 。 
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2. 用 kill 终止 进程 


ps 命令 经 常 与 kill 命令 联合 使 用 , 用 于 终止 卡 住 或 经 历 很 长 时 间 尚 未 完成 的 进程 。 基 本 过 程 是 ， 
先 用 ps 查 得 进程 号 ， 再 用 kill 命令 终止 进程 。 比 如 在 下 面 的 实例 中 ， 终 端 窗口 1 启动 了 一 个 文件 查 
找 命令 find / -name xxxr， 查 找 本 机 上 名 为 xxx 的 所 有 文件 。 由 于 该 命令 执行 时 间 太 长 ， 因 此 用 户 希 
望 终止 它 。 打 开 另 一 个 终端 窗口 2， 先 用 ps 查 得 find 进程 的 PID 为 2201， 然 后 输入 命令 1 -9 2201 
终止 该 进程 。find 进程 终止 后 ， 终 端 窗口 1 立即 显示 Terminated， 并 显示 命令 提示 符 $， 如 图 5-10 
所 示 。 其 中 ，kHill 命令 带 命令 选项 -9 表示 强行 终止 后 面 PID 为 2201 的 进程 。 


终端 2: 

Sps -u can 
2108 ? 00:00:01 update-notifier 
2180 pts/1 00:00:00 bash 

sis 2201 pts0 00:00:01 find 
Terminated 2202 pts/1 00:00:00 ps 
can@ubuntu:~$ S$ kill -9 2201 


图 5-10 kill 命令 的 典型 使 用 方法 


3. 后 台 执行 进程 


通常 情况 下 ， 在 终端 输入 一 个 命令 后 ， 要 等 待 该 命令 执行 完 才能 输入 下 一 个 命令 ， 这 种 模式 称 
为 前 台 执 行 , 但 有 时 会 带 来 不 便 。 比 如 , 我 们 在 一 个 终端 窗口 中 用 命令 gedit 打开 一 个 输入 源 代 码 的 
编辑 窗 ， 由 于 gedit 命令 没有 结束 ， 在 命令 窗口 中 也 不 输入 新 的 命令 ， 却 占据 着 桌面 空间 ， 因 此 会 影 
响 工作 效率 。Linux 允许 在 命令 串 的 后 面 增加 一 个 字符 &， 通 过 让 命令 在 后 台 执行 来 解决 这 个 问题 。 
比如 ， 我 们 用 命令 gedit & 打 开 编 辑 窗口 ，gedit 进程 就 在 后 台 运 行 ， 虽 然 gedit 进程 尚未 结束 ， 但 命 
令 窗口 中 的 命令 提示 符 $ 却 立即 显示 ， 可 以 在 该 窗口 中 输入 新 的 命令 ， 如 图 5-11 所 示 。 


3 加 opeo - 图 :ve 台 
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图 5-11 让 命令 在 后 台 执行 


5.2.6 ”编程 读 取 进程 属性 


进程 的 属性 信息 保存 在 操作 系统 内 核 的 进程 控制 块 PCB) 中 ,包括 进程 标识 ID、 代码 数 据 位 置 、 
用 户 、 打 开 文 件 信息 ， 等 等 。 应 用 程序 常常 需要 读 取 进 程 标识 PID、 父 进程 标识 PPID、 用 户 标识 
UID、 组 标识 GID 等 信息 。 进 程控 制 和 进程 间 通 信 需 要 先 获取 进程 PID，Linux 系统 提供 了 getpid 
与 getppid 系统 调用 函数 ， 用 于 进程 获取 自身 与 父 进程 的 PID: 


#include <sys/typesh> 
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#include <unistd h> 
pid t getpid(void); /返回 当前 进程 PID 
pid t getppid(void); /返回 父 进程 PPID 


每 个 进程 还 有 两 个 用 户 UID 属性 非常 重要 ,其 中 实际 用 户 ID(UID) 是 创建 进程 的 用 户 ID,， 有 效 
用 户 D(EUID, Effective UID) 是 用 于 决定 是 否 授权 资源 访问 的 用 户 ID， 可 能 是 启动 进程 的 实际 用 户 
ID， 也 可 能 是 命令 文件 所 属 用 户 的 用 户 DD。 同 样 每 个 进程 有 两 个 用 户 组 属性 :用 户 组 ID(GID) 是 创 
建 进程 用 户 的 ID， 有 效用 户 组 ID(EGID, Effective GID) 是 用 于 决定 是 否 授权 资源 访问 的 用 户 组 ID。 
获得 用 户 标识 与 用 户 组 标识 的 系统 调用 函数 声明 如 下 : 


#include <sys/types h> 

#include <unistd.h> 

uid t getuid(void); 。/* 返回 当前 进程 实际 用 户 ID */ 
uid tf geteuid(void); ”人 * 返回 实际 有 效用 户 ID 所 

gid t getgid(void); 人 # 返回 当前 进程 实际 用 户 组 ID */ 
uid t ”getegid(void); ” /# 返回 实际 有 效用 户 组 ID */ 


getids.c 演示 了 编程 验证 进程 标识 信息 获取 函数 的 用 法 ， 源 代码 如 下 : 


int main(int argc.char* argv[]) 

上 
Printf("pid=9%d ",getpidO); 上 # 输出 进程 PD */ 
printf("ppid=%d ",getppid0): 。” /* 输出 父 进程 PPID */ 
printf"uid=%d "getuid0) 上 输出 实际 用 户 JD 类 
printft"euid=%d ",geteuid0); 人 # 输出 有 效用 户 ID 所 
printf("gid=9d ",getgid0);  ” 族 输出 实际 用 户 组 ID */ 
printfl"egid=%d\n",getegid0); 入 输出 有 效用 户 组 ID */ 


retum 0; 

} 

下 面 是 执行 结果 : 
Ssu # 切 换 为 root 用 户 身份 
Password: 齐 答 入 root 用 户 的 密码 ， 输 入 时 不 显示 任何 内 容 
#gcc -0 getids getids.c # 编 译 getids 
#1s -1 
-IWXI-XI-X ] rootroot 7566 Mar 20 03:37 getids 
# /getids # 以 管理 用 户 身份 执行 ， 显 示 进程 信息 
pid=13879 ppid=13780 uid-0 euid-0 gid-0 egid-0 
# .exit 丰 退 出 root 用 户 身份 
S whoami # 查 看 当前 用 户 是 谁 
can 
$ /getids # 以 普通 用 户 身份 执行 ， 显 示 进程 信息 


pid=13877 ppid=13778 uid=1000 euid=1000 gid=1000 egid=1000 

从 上 述 运行 结果 可 以 看 出 ，getids 程序 以 root 身份 运行 时 ，UID 和 GID 都 是 0， 而 以 can 身份 
运行 时 ， 这 些 ID 都 是 1000。 因 此 ， 进 程 的 UID、GID 属性 分 别 是 创建 进程 的 用 户 ID 和 组 ID。 
*5.2.7 ”进程 权限 和 文件 特殊 权限 位 

在 Linux 系统 中 ， 每 个 文件 的 访问 权限 有 12 位 ， 位 编号 为 0-11， 其 中 0-8 为 所 属 用 户 、 所 属 
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用 户 组 和 其 他 用 户 对 文件 的 访问 权限 。 还 有 三 个 特殊 权限 位 9~11， 用 于 提供 特殊 文件 保护 功能 ， 以 
满足 一 些 应 用 场景 的 需要 。 


1. set 位 权限 (suid、sgid) 


set 位 权限 有 两 个 : suid 和 sgid， 分 别 对 应 可 执行 文件 属 主 和 属 组 的 身份 。suid 位 权限 对 应 12 
位 权限 的 位 11， 如 果菜 文件 设置 了 suid 权限 ， 则 该 文件 属 主 的 可 执行 权限 位 显示 为 s。sgid 位 权限 
对 应 位 10, 如 果 某 文件 设置 了 sgid 权限 , 则 该 文件 属 组 的 可 执行 权限 位 显示 为 s。 suid 权限 位 和 sgid 
位 分 别 用 命令 chmoduts 药 傣 名 、chmod gts 成 伴 儿 设置 。 

设置 完 set 权限 位 后 ， 进 程 EUID、EGID 将 为 文件 属 主 UID、 属 组 GID 以 文件 属 主 、 属 组 身份 
操作 文件 ， 否 则 只 能 以 进程 创建 者 身份 操作 系统 资源 。Linux 使 用 set 权限 位 顺利 地 解决 了 普通 用 户 
无 权 访 问 密码 文件 shadow， 但 可 通过 命令 passwd 更 改 个 人 密码 的 问题 。 为 了 保护 用 户 密码 不 被 暴 
力 破解 ，Linux 系统 不 允许 普通 用 户 读 写 密码 文件 /etc/shadow， 读 和 写 都 不 允许 ,但 却 需 要 允许 用 户 
通过 执行 passwd 来 修改 /etc/shadow 文件 中 属于 自己 的 密码 。 给 密码 修改 命令 /usr/bin/passwd 添加 s 
权限 ， 就 解决 了 这 个 难题 。 用 命令 8 /lsr/bin/passwdq -1 可 查看 passwd 文件 的 访问 权限 如 下 : 

-rwst-xr-x 1 root root 45420 Jul 15 2015 /ust/bin/passwd 


由 于 拥有 者 有 s 权限 ， 当 普通 用 户 执行 该 命令 时 ， 进 程 的 EUID 更 换 为 passwd 文件 主 root 的 
UID 0， 因 此 有 权限 将 新 的 密码 写 入 /etc/shadow。 
给 程序 getids 增加 “s” 权 限 以 进行 验证 : 
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Ssu # 切 换 成 root 用 户 身份 

Password: # 答 入 root 用 户 的 密码 ， 为 保密 起 见 ， 无 任何 显示 
#chmod uts,gts getids # 给 前 面 产 生 的 文件 getids 增加 s 权限 

#1ls -1 getids # 检 查 文件 getids 是 否 有 s 权限 标志 

-ITWSI-SI-X 1 root root 7566 Mar 20 03:37 getids 

# .exit 太 朋 出 root 用 户 身份 

$ /getids # 执 行 getids， 显 示 进程 


pid=13877 ppid=13778 uid=1000 euid=0 gid=1000 egid=0 
结果 表明 : 获得 set 权限 后 ，getids 以 普通 用 户 can 身份 运行 ,实际 用 户 ID 为 can 的 UID 1000， 
而 有 效用 户 ID 却 变 成 getids 所 属 用 户 root 的 UID 0。 这 样 ，getids 就 具有 root 用 户 权 限 了 。 


2. 粘 滞 位 (sticky) 权 限 


在 Linux 系统 中 ， 用 户 对 某 目录 有 写 权 限 ， 表 示 可 在 该 目录 下 创建 、 删 除 文件 。 但 如 果 仅 赁 是 
否 有 w 权限 来 进行 文件 访问 授权 的 话 ， 很 多 情况 下 可 能 会 导致 冲突 、 错 误 甚至 故障 。 比 如 ，Linux 
系统 有 一 个 临时 目录 /tmp， 其 权限 设置 为 rwxrwxrwx， 人 允许 任何 用 户 在 其 中 创建 、 删 除 文件 。 设 想 
某 用 户 运行 应 用 程序 ， 在 /tmp 中 创建 一 个 临时 文件 tmpfile， 并 将 一 些 重要 数据 暂 存 到 其 中 ， 如 果 另 
一 用 户 恰好 有 意 或 无 意 把 文件 tmpfile 删 掉 了 ， 就 会 导致 前 一 用 户 的 应 用 程序 出 错 。 

为 了 避免 这 种 情况 发 生 ，Linux 文件 目录 还 有 粘 滞 位 权限 ， 对 应 12 位 权限 的 位 9， 文 件 目录 设 
置 了 粘 滞 位 权限 后 ， 其 他 用 户 的 可 执行 权限 位 显示 为 t 用 命令 chumod +t 盛 众多 进行 设置 。 若 文件 
目录 设置 了 粘 沾 位 权限 ， 则 某 用 户 在 其 中 创建 的 文件 只 能 由 该 用 户 修改 、 删 除 ， 其 他 普通 用 户 无 权 
更 改 文件 内 容 。Linux 的 /tmp 目录 就 通过 设置 粘 滞 位 权限 来 防止 用 户 删 除 别人 的 文件 。 下 面 是 一 个 
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仿 证 实例 : 


Sls /lgrep tmp 
drwxrwxrwt 8rootroot 4096 Mar31 06:09 tmp 


S$ cd /mp 

$ whoami # 显 示 当 前 用 户 名 

can 

Stouch flel # 用 户 can 创建 一 个 文件 

Ssu guest # 用 户 身份 临时 更 换 成 guest 

Passwd: # 答 入 用 户 guest 的 密码 ， 因 保密 起 见 ， 无 任何 显示 
$ whoami # 显 示 当 前 用 户 名 ， 验 证 切换 是 否 成 功 

guest 

Sm 了 flel # 用 户 guest 试图 删除 用 户 can 创建 的 文件 时 报错 


Im cannot remove ‘a’: Operation not permitted 


进程 控制 


Linux 系统 启动 时 ， 会 生成 一 个 名 为 init 的 进程 ， 该 进程 是 系统 运行 的 第 一 个 进程 ， 进 程 PD 
为 1， 是 操作 系统 的 进程 管理 器 ， 也 是 其 他 所 有 进程 的 祖先 进程 。 虽 然 可 以 通过 执行 一 条 命令 、 启 
动 一 个 程序 、 打 开 一 个 终端 窗口 等 方式 来 创建 一 个 新 的 进程 ， 但 创建 新 进程 归根 结 底 是 通过 父 进程 
执行 fork 系统 调用 函数 来 实现 的 。 一 般 父 进程 先 调用 fork 函数 复制 出 子 进程 ， 再 让 子 进程 调用 exec 
系统 来 加 载 不 同 的 程序 代码 ， 此 后 父 进程 可 继续 创建 子 进 程 ， 子 进程 也 创建 自己 的 子 进程 ， 最 终 创 
建 出 丰富 多 彩 的 进程 世界 ， 形 成 一 棵 以 init 进程 为 祖先 的 进程 树 。 


5.3.1 创建 进程 


1. 分 析 使 用 fork 系统 调用 创建 进程 的 过 程 
在 Linux 操作 系统 中 ， 通 过 fork 系统 调用 来 创建 子 进 程 。 使 用 方法 如 下 : 


pid t fork(void): 


父 进程 执行 fork 系统 调用 后 ， 子 进程 就 诞生 了 ， 新 创建 的 子 进程 几乎 但 不 完全 与 父 进程 相同 : 
程序 代码 与 父 进程 相同 ， 变 量 值 从 父 进程 复制 而 来 ， 接 下 来 也 从 fork 函数 调用 返回 ， 再 往 下 执行 ; 
不 同 的 是 ，fork 系统 调用 的 返回 值 不 同 ， 程 序 代码 可 根据 返回 值 判断 是 父 进程 还 是 子 进程 ， 并 据 此 
执行 不 同 的 处 理工 作 。forkl.c 是 一 个 使 用 fork 系统 调用 创建 子 进程 的 示例 ， 源 代码 如 下 : 


让 forkl.c 源 代码 */ 
1 intmainO 


2 
3 pid tpid: 
4 
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6 Pid = forkO:; 

7 if(pid—0){ 访 子 进程 执行 这 段 代码 *#/ 

a X=xX+]1; 

9 printf("child: x=%d\n", x): 

10 } 

11 

12 (pid>0) { 上 # 父 进程 执行 这 段 代码 */ 

13 Xx-1; 

14 printf (“parent: x=%d\n",x): 

15 } 

16 sleep(10); 上 # 父子 进程 都 执行 的 代码 */ 

| 

现在 打开 两 个 终端 窗口 ， 分 别 用 于 编译 执行 forkl.c 和 显示 forkl 进程 信息 ， 结 果 如 下 。 
终端 窗口 一 : 终端 窗口 二 : 

Sgce -0 forkl forkl.c Sps -ef|grep forkl 

$ /ork1 can 3400 2854 018:30pts/l 00:00:00 /forkl 

child: x=2 can 3401 3400 018:30pts/l 00:00:00 /forkl 

parent: x=0 can 3403 3380 018:30pts/3 00:00:00 grep --color=auto forkl 


Sps -ef|grep forkl 
can 3405 3380 018:31pts/3 00:00:00 grep --color=auto forkl 
终端 窗口 一 执行 .forkl 的 输出 语句 后 ， 父 子 进程 都 会 执行 sleep(10)， 睡 眠 10 秒 钟 。 在 此 期 间 ， 
在 终端 窗口 二 中 输入 ps -ef| grep fork1, 显示 确实 有 两 个 ./forkl 进程 存在 , PID 分 别 为 3400 和 3401， 
而 进程 3401 的 父 进程 PID 为 3400。10 秒 后 ， 再 次 用 命令 ps ”-ef 查询 forkl 进程 信息 时 ，forkl 进 
程 已 不 复 存 在 。 
下 面 分 析 使 用 fork 系统 调用 创建 进程 的 过 程 ， 说 明 打 印 两 个 不 同 x 变量 值 的 原因 。 

(1) 程序 启动 时 : 如 图 5-12 左 半 部 分 所 示 ， 系 统 加 载 程 序 ， 为 变量 分 配 内 存 ， 为 父 进程 创建 进 
程控 制 块 PCB)， 并 在 其 中 填写 分 配给 该 进程 的 PID( 假 设 为 2015)、 代 码 地 址 、 数 据 集 地 址 和 其 他 属 
性 ， 在 进程 数据 集中 ， 变 量 x 和 pid 的 内 容 不 定 。 

(2) 父 进程 执行 赋值 语句 “x=1”: 如 图 5-12 右 半 部 分 所 示 ， 程 序 将 整数 1 写 入 变量 x 所 在 的 
存储 单元 。 

G3) 父 进程 执行 fork 系统 调用 (参阅 图 5-13): 

@ 系统 首先 创建 子 进程 PCB， 内 容 从 父 进程 PCB 复制 而 来 ， 但 PID 是 新 分 配 的 唯一 整数 (这 
里 假设 为 2016); 

@ 创建 父 进程 数据 集 的 一 个 副本 ,保存 于 新 分 配 的 存储 器 中 ， 作 为 子 进程 数据 集 ， 其 中 变量 x 
的 值 也 是 1， 以 后 子 进程 仅 对 属于 自己 的 数据 集 进 行 操作 ; 

@ 子 进程 PCB 中 的 数据 集 地 址 指向 子 进程 自己 的 数据 集 ， 有 了 程序 代码 、 数 据 集 和 PCB, 一 
个 完整 的 子 进程 就 创建 出 来 了 。 这 样子 进程 除 PID 与 父 进程 不 同 外 ， 程 序 代码 和 数据 都 与 父 进程 一 
模 一 样 ，fork 函数 完成 了 对 父 进程 的 复制 工作 ; 
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程序 启动 时 
父 进程 代码 


{ 
pid tpid; 
intx= 1; 
pid = fork(X 
if (pid== 0){ 
Xxtl; 
printf("child: x=%d\n", x 
} 
if (pid>0) { 
X=x-l; 


Printf ("parent: x=%d\n",x); 


sleep(10) 
} 


父 进 程 PCB 


sleep(10); 
} 


执行 “xl” 后 
父 进程 代码 


int main() 


pid_t pid; 
inx=1 
pid=fork() 
if(pid==0) { 
Xx+1; 


printfwehild: x=%dn", x 


EX-1; 
Printf ("parent: x=%d\n",x); 


5-12 与 进程 对 应 的 PCB 和 数据 集 示意 图 


父 进程 PCB 
| 代码 地 址 “| 
1 数据 集 地 址 | 


@ 由 于 子 进程 从 父 进程 复制 而 来 ， 程 序 计算 器 PC 中 具有 相同 的 地 址 当 获 得 CPU 后 ， 下 一 条 
指令 或 语句 也 与 父 进 程 一 致 ， 父 进程 接 下 来 从 fork 系统 调用 返回 ， 子 进程 也 一 样 ， 因 此 ， 父 子 进 程 
的 fork 系统 调用 都 需要 一 个 返回 值 。 这 样 在 父子 进程 的 数据 集中 都 有 一 个 “fork 函数 返回 值 ”项 ， 
Linux 系统 规定 , 父 进程 fork 系统 调用 的 返回 值 为 子 进程 的 PID( 在 这 里 假定 为 2016), 子 进程 的 fork 
返回 值 为 0， 并 由 系统 填 入 父子 进程 的 数据 集中 ， 如 图 5-13 所 示 。 

此 后 ， 子 进程 作为 一 个 独立 的 进程 开启 了 自己 的 生命 周期 ， 往 下 执行 。 


父 进程 
代码 


int main() 


{ 
pid_t pid; 
int x= 1; 
pid = forkO|; 
if (pid==0){ 
ZK 
printff"child: x=%d\n", x); 
} 
if (pid>0) { 
X=x-1; 


printf ("parent: x=%d\n",x); 


sleep(10); 
} 


多 进 pcB 


[ = 
ipiD:2015 | 
| 代码 地 址 1} 
| 

集 地 址 
| 


子 进程 pcB 


int main() 


pid_t pid; 

intx=1; 

pid = forkO; 

if (pid==0) { 
x=x+1; 


} 
if (pid>0) { 
X=X-1; 


sleep(10); 
} 


Printff"child: x=%d\n", x); 


printf ("parent: x=%d\n",x); 


子 进 各 
代码 


图 5-13 fork 系统 调用 如 何 创建 进程 


(4) fork 系统 调用 返回 后 父子 进程 的 执行 路 径 (参看 图 5-14): 


Q fork 系统 调用 完成 子 进程 的 创建 后 , 父子 进程 都 有 相同 的 程序 代码 ， 从 函数 调用 返回 开始 往 
下 运行 ， 从 数据 集中 读 取 fork 返回 值 ， 赋 值 给 pid 变量 ， 因 此 父 进程 的 pid 变量 被 写 入 2016， 子 进 


程 的 pid 变量 被 写 入 0; 


@ 接 下 来 父子 进程 都 往 下 执行 ， 判 断 让 条 件 ， 决 定 是 否 执行 让 分 支 。 由 于 父 进 程 pid>0， 子 进 
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程 pid 一 0， 因 此 父 进 程 将 进入 这 pid>0) 分 支 ， 子 进程 将 进入 iftpid 一 0) 分 支 。 
@ 父 进 程 执行 这 pid>0) 分 支 时 ， 遇 到 语句 xx - 1， 变 量 x 的 初 值 是 1， 减 1 后 写 回 ， 变量 x 
的 值 变 成 0， 子 进程 执行 这 pid 一 0) 分 支 时 ， 变 量 x 的 初 值 也 是 1， 执 行 加 1 后 写 回 ， 子 进程 中 变量 
x 的 值 变 成 2。 因 此 ， 最 后 程序 的 输出 结果 是 : 父 进 程 0， 而 子 进程 x=2。 
@ 完成 站 语句 块 后 ， 两 个 进程 都 要 执行 最 后 的 sleep 语句 ， 睡 眠 10 秒 钟 ， 让 用 户 有 时 间 查 看 
进程 信息 。 
父 进程 子 进程 
代码 代码 


int main() 
i pid; 
i forkO:; 

lif(pid—= 0) 
ee X=% 


1 xt; 
| printf("child: x=%d\n", x): 


X=X-1; 


X=X-1; ; 
Pprintf ("parent: x=%d\n",x); 


| Printf ("parent: X=%d\n",x); 
} 


1 
1sleep(10): 
5- 


5-14 fork 系统 调用 返回 后 父子 进程 的 执行 路 径 


fork 函数 返回 后 ， 父 子 进程 是 两 个 独立 的 进程 实体 ， 互 不 相关 ， 并 发 执行 。 也 就 是 说 ， 两 个 进 
程 接 下 来 的 代码 段 (用 虚 框框 起 的 代码 ) 可 能 同时 执行 、 交 错 执行 或 按 先后 顺序 执行 ,两 个 进程 的 printf 
语句 谁 先 谁 后 ， 是 不 确定 的 。 因 此 ， 输 出 结果 中 子 进 程 输出 在 前 是 正常 的 ， 但 即便 父 进程 输出 在 前 ， 
也 是 正常 的 。 

以 = 思考 与 练习 题 5.8 ”程序 forkl.c 的 第 13 行 代 码 是 “if(pid>0) {f”， 将 其 改 为 “else {”， 程 序 
的 语义 不 变 。 请 解释 为 什么 ? 
和 ”思考 与 练习 题 5.9 阅读 下 面 的 程序 ， 请 问 子 进程 和 父 进 程 的 输出 各 是 什么 ? 


intmain() 
{ intx=1: 
if(fork0 一 0) 
printf ("printfl: x=%d\n", ++x); 
printf("printf?: x=%d\n" , --x): 
} 
2. 进程 族 亲 关系 图 和 程序 分 析 


画 进程 族 亲 关系 图 对 多 进程 应 用 程序 分 析 通 常会 有 所 帮助 ， 其 中 ， 每 个 进程 用 一 个 方 框 表 示 ， 
父 进程 画 在 上 边 ， 子 进程 画 在 下 边 ， 父 进程 用 箭头 指向 子 进程 ， 一 个 箭头 可 看 作 执行 一 次 fork 函数 
调用 。 图 5-15 是 执行 一 次 fork 函数 调用 的 进程 族 亲 关系 图 。 
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进程 族 亲 

FREER 关系 图 
int main() 
{ 

fork(); [| 

printf ("hello\n") ; 

exit(0); 
} p11 


5-15 ”进程 族 亲 关 系 示 意图 


以 下 面 的 fork2.c 程序 为 例 ， 分 析 进 程 间 族 亲 关系 和 程序 输出 。 


启 fork2.c 源 代码 村 

1  #nclude <unistdh> 

2 int main0 

| 

4 int pid; 

5 Pid-forkO; 

6 Pid-forkO; 

7 if (pid>0)forkO; 

8 printf("hello \n"): 
exit(0): 

10 } 


程序 执行 和 进程 产生 过 程 如 图 5-16 所 示 。 

(1) 程序 启动 时 ， 系 统 创建 进程 pl; pl 执行 程序 中 的 第 一 个 fork 函数 调用 ， 创 建 子 进程 p11， 
两 个 进程 的 pid 变量 值 分 别 为 p11 的 PD 和 0， 即 pl.pid=PID(@p11),，pl1.pid=0。 

(2) 接 下 来 pl、p11 都 执行 程序 中 的 第 2 个 fork 函数 调用 ， 分 别 创建 进程 p12 与 p111， 四 个 进 
程 的 pid 变量 值 分 别 为 pl.pid=PID(p12)、p11.pid=PID(p111)、p12.pid=0、pl111.pid=0。 

(3) 之 后 ， 条 件 pid>0 为 真 的 两 个 进程 pl 和 p11 执行 第 三 个 fork 函数 调用 ， 分 别 创建 进程 p13 


和 pl12。 
(4) 最 后 ，6 个 进程 均 往 下 执行 printf， 产 生 6 行 输出 ， 并 分 别 执行 exit(0) 语 句 而 终止 。 
和 main() 
pid=fork(); pid=fork(); if(pid>0) fork(); Printfl"hello \n"); exit(0); 


二 


图 5-16 er 


能 看 到 六 个 同时 存在 的 进程 ， 在 最 后 的 fork 函数 调用 语句 后 增加 语句 sleep(10)， 使 最 后 一 
人 10 秒 ， 在 另 一 个 终端 窗口 中 输入 ps 命令 以 查看 产生 的 进程 信息 。 新 程序 保 
存 为 fork2s.c。 


广 fork2sc 源 代码 */ 

1  #include <unistdh> 
2 int main0 

3 { intpid: 
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pid =fork0: 

Pid=forkO: 

if(pid>0) forkO; 
printf hello m 
sleep(10): 

exit(0); 


现在 ， 在 终端 窗口 1 中 编译 执行 程序 : 


Sgce -0 fork2s fork2s.c 
§ /fork2s 
hello 


可 以 看 到 总 共有 6 行 输出 。 现 在 打开 另 一 终端 窗口 2， 用 ps 命令 查看 进程 信息 ， 用 grep fork2s 
显示 包含 fork2s 的 所 有 输出 行 : 


Sps -eflgrep fork2s 


can 4458 3771 001:27pts/0 00:00:00 /fork2s 
can 4459 4458 001:27pts/0 00:00:00 /fork2s 
can 4460 4458 001:27pts/0 00:00:00 ./fork2s 
can 4461 4458 001:27pts/0 00:00:00 ./fork2s 
can 4463 4459 001:27pts/0 00:00:00 ./fork2s 
can 4464 4459 001:27pts/0 00:00:00 ./fork2s 
can 4468 4343 001:27pts13 00:00:00 grep fork2s 


可 见 ， 程 序 执行 时 产生 了 6 个 进程 ， 通 过 PPID 和 PID 字段 检查 各 进程 间 族 亲 关 系 ， 发 现 与 图 
5-16 一 致 。 
办 > 思考 与 练习 题 5.10 ”分 析 以 下 程序 的 执行 ， 最 终 会 产生 几 个 进程 ? 各 进程 中 变量 flag 的 最 
终 取 值 是 多 少 ? 
#include <unistdth> 
int flag=1:; 
int mainO{ 
pid t pid: /位 置 @ 
pid=fork0: 这 pid>0) fas=flag+l: 让 pid 一 0) flag-flag+2; /位 置 @ 
pid=fork0: 这 pid>0) fag=flag+10: 让 (pid 一 0) fiag=flag+20: /位置 @ 
Pid= fork0: ifpid>0) flas=flag+100: if(pid 一 0) flag=flag+200: /位 置 @ 
pid=fork0: iftpid>0) flag=flag+1000: 让 (pid 一 0) flag=flag+2000:; /位 置 @ 
Printf("flag=%6d\n" flag): 
} 
位 置 () 父 进 程 pidl: flag=1 
位 置 @) 父 进程 pid1: flag=1+1=2; pidl 的 第 1 个 子 进程 pid11: flag=1+2=3 
位 置 @) 父 进程 pidl: flag=2+10=12; 进程 pld11: flag=3+10=13 
pidl 的 第 2 个 子 进程 pid12: flag=2+20=22 
子 进程 pid11 的 第 1 个 子 进程 pid111: flag=3+20=23 
位 置 @ pidl: flag=12+100=112 pidll: flag=13+100=113 
pid12: flag=22+100=122 ”pid111: flag=23+100=123 
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新 的 子 进程 pid13: flag=12+200=212 pid112: flag=13+200=213 
pid121: flag=22+200=222 pid1111-flag=23+200=223 
位 置 @® 请 读者 自己 分 析 。 
多 思考 与 练习 题 5.11 在 图 5-16 中 ， 下 面 哪些 进程 对 一 定 是 并 发 的 ? 
(Dpl 和 pll (2)pl 和 pl12 (3)pl12 和 p13 
多 ”思考 与 练习 题 5.12 分 析 下 面 四 个 程序 各 产生 几 行 输出 ? 


exforkl.c: exfork2.c: exfork3.c: 
intmain0 intmain0 int main0 
{ int i { int { 
forkO:; i=fork(O); int i 
forkO; i=forkO; for(;;) 
forkO: i=forkO:; fork0: 
fork0: 这 i>0) printf'hello 
printft"hellom'"): printf("hellon"); Y 


3. 编写 多 进程 并 发 程序 
要 编写 多 进程 并 发 程序 ， 首 先 可 确定 要 创建 几 个 进程 ， 根 > 
据 进 程 间 关系 画 出 进程 间 族 亲 关系 ， 确 定 每 个 进程 要 做 什么 ， 了 
然后 根据 进程 族 亲 关系 ， 画 出 程序 框架 ， 最 后 填 入 每 个 进程 要 


pli p12 p13 


执行 的 代码 。 

下 面 通过 示例 程序 fork3.c 说 明 多 进程 程序 的 编写 方法 。 假 
设 要 编写 一 个 多 进程 应 用 程序 , 各 进程 之 间 的 关系 如 图 5-17 所 图 5.17 多 进程 并 发 程序 编程 示例 
示 ， 要 求 各 个 进程 打印 各 自 的 PID。 

第 一 步 : 画 出 程序 框架 。 


int mainO 让 第 1 个 进程 为 p1， 执 行 main 函数 沁 


1 

2 

3 int pl1p12.p13.p121; /# 先 定义 fork 返回 值 */ 

4 

5 pll=fork0: 访 pl 创建 第 一 个 子 进程 pl1 */ 

6 iftp1l1—0) { 上 # 子 进程 p11 执行 这 个 分 支 关 p11 

7 << 子 进程 p11 的 功能 代码 >> 

8 exit(0): 

9 } 

， 2 
11 ifgpll>o){ 上 # 父 进程 pl 


12 p12=forkO: 人 P1 创建 第 2 个 子 进程 p12 */ 


13 iftp12—0) { 人 # 进程 p12 执行 这 个 分 支 机 

14 p121=fork0: ”证 p12 创建 子 进程 p121 */ 

15 这 pl121 一 0) { 上 # 孙 子 进程 p121 执行 这 个 分 支 所 

16 << 孙 子 进程 p121 的 功能 代码 >> 

2 > 0 p121 
19 iftp121>0) { 


20 << 子 进程 p12 的 功能 代码 >> 

21 exit(0); 

22 } 

23 } 

24 else { P12>0， 父 进程 pl 执行 这 个 分 支 所 
25 p13=fork0; 上 # 父 进 程 pl 创建 第 3 个 子 进程 p13 */ 
26 if(p13 一 0) { 入 第 3 个 子 进程 p13 执行 这 段 代码 */ 
27 < 进程 p13 的 功能 代码 > 9 
28 exit(0); 

29 ; 

30 ifp13>0) { 片 父 进程 pl 执行 这 个 分 支 */ 

31 << 父 进程 pl 的 功能 代码 >> 

32 exit(0): 

33 } 

34 } 店 这 p11>0) 分 支 在 这 里 结束 

35 


第 二 步 : 将 各 进程 的 功能 代码 填 入 程序 。 在 本 例 中 ， 各 进程 的 功能 代码 是 输出 各 自 的 PD， 由 
于 进程 获得 PID 的 函数 调用 都 是 getpid， 因 此 所 有 进程 的 功能 代码 都 是 printf"My PID=%dn", 
getpid0)。 用 这 行 代码 替换 第 7、16、20、27、31 行 的 注释 即 可 。 

在 实际 应 用 开发 中 ， 在 每 个 进程 的 代码 后 面 添加 一 行进 程 终止 代码 exit(0) 是 很 好 的 习惯 ， 可 避 
免 很 多 差错 。 
多 思考 与 练习 题 5.13 ”如 何 判 断 程序 fork3.c 产生 的 进程 符合 图 5-17 所 示 的 族 亲 关系 ? 


5.3.2 ”多 进程 并 发 特征 与 执行 流程 分 析 


我 们 先 看 一 个 两 进程 并 发 示例 程序 fork4.c。 在 该 程序 中 ， 父 进程 打印 “this is the parent”3 次 ， 
子 进程 打印 “this is the child”6 次 ， 各 进程 前 后 两 次 输出 之 间 睡 眠 1 秒 钟 。 


店 fork4.c 源 代码 */ 
1 #include "wrapper.h" 


2 intmainO) 

3 { 

4 pidtpid; intn:; 

5 pid-fork0; /创建 进程 

6 

7 这 pid 一 0) {// 子 进程 将 执行 这 个 分 支 
8 fora=6n>0:n-){ 

9 printft"This is the child\n"): 

10 sleep(1): 

11 

12 exit(0): 

13 } 

14 

15 站 (pid>0) ”// 父 进程 将 执行 这 个 分 支 
16 { 

17 for(n=3:n>0:n-){ 

18 printft"This is the parenf\n"): 

19 sleep(1): 
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现在 编译 和 执行 程序 : 


Sgcec -0 fork4 fork4.c 
$ /ork4 

This is the child 

This is the parent 

This is the child 

This is the parent 第 @ 
This is the child 
This is the parent © 
This is the child 
can@ubuntuS 
Thisis the child 

Thisis the child 

下 面 分 析 产 生 上 述 输 出 结果 的 原因 。 上 述 程序 启动 后 ， 父 进程 执行 fork 函数 调用 ， 创 建 一 个 子 
进程 。 接 下 来 父子 进程 分 别 打 印 3 次 “This is the parent” 和 6 次 “This is the child”, 每 执行 一 次 printf 
函数 调用 ， 睡 虐 1 秒 。 由 于 父子 进程 并 发 执行 ， 子 进程 抢 到 了 先 机 ， 打 印 一 行 “This is the child”( 第 
中 行 ， 执 行 sleep(1)， 睡 眠 1 秒 钟 ， 放 弃 CPU; 接 下 来 父 进程 获得 CU， 执行 printf 函数 调用 ， 打 
印 “This is the parent”( 第 @ 行 ), 执行 sleep(1), CPU 切换 回 子 进程 ; 如 此 反复 , 导致 “This is the child” 
与 “This the parent” 交 错 显示 。 父 进程 完成 最 后 一 次 printf 输出 (第 @ 行 ) 后 ，CPU 切换 到 子 进程 打印 
其 第 4 次 输出 (第 @ 行 )， 接 下 来 父 进程 再 次 获得 CPU， 执 行 exit(0) 以 终止 程序 ， 系 统 显示 命令 提示 
符 $， 表 示 用 户 可 以 输入 下 一 条 命令 了 。 由 于 此 时 子 进 程 尚未 结束 ， 因 此 其 输出 显示 在 提示 串 (本 例 
中 为 can@ubuntu$) 之 后 ， 为 第 @ 和 第 @ 行 。 

使 用 fork 函数 创建 的 子 进程 是 一 个 独立 的 进程 实体 ， 父 子 进程 的 多 个 并 发 活动 (或 代码 段 ) 可 以 
交错 执行 、 同 时 执行 或 错开 执行 。 在 这 里 将 每 种 并 发 执行 顺序 看 成 一 种 交错 模式 。 交 错 模式 的 数量 
与 并 发 操作 (或 活动 、 指 令 ) 的 数量 呈 指 数 关系 。 有 些 交 错 模式 会 产生 正确 结果 ， 有 些 则 不 会 。 为 确 
保 程序 得 到 正确 的 执行 结果 ， 可 以 运用 排列 组 合理 论 ， 列 出 所 有 交错 顺序 ， 找 出 所 有 可 能 导致 不 正 
确 结果 的 交错 模式 ， 为 改进 程序 提供 依据 。 

下 面 用 多 进程 并 发 实例 程序 fork5.c 说 明 这 个 特性 。 

让 fork5.c 源 代码 */ 

#include<stdlib.h> 

i 


EEEEE 
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我 们 先 识别 和 画 出 程序 的 并 发 关系 图 ， 如 图 5-18 所 示 。 程 序 刚 启动 时 ， 仅 有 父 进 程 存在 ， 父 进 
程 执行 fork 函数 调用 创建 子 进程 后 ， 父 子 进 程 并 发 执行 ， 该 程序 有 两 个 并 发 的 逻辑 控制 流 。 父 进程 
按 顺序 执行 两 个 输出 操作 A 和 B, 子 进程 按 顺 序 执行 操作 C 和 DD。 由 于 两 个 进程 的 活动 为 并 发 关系 ， 
因此 可 以 按 任何 顺序 交错 执行 ， 甚 至 并 行 执行 。 因 此 ， 本 例 中 父 进程 的 输出 结果 ab 会 与 子 进程 的 输 
出 结果 cd 交错 显示 ， 可 能 的 输出 顺序 有 六 种 : abcd、acbd、acdb、cdab、cadb、cabd。 


父 进程 上 子 进程 
-—-------J---------= 时 间 线 
人 | 1 
并 发 活动 


图 5-18 ”fork5.c 并 发 关系 图 

观察 程序 的 实际 输出 需要 考虑 两 种 情况 : 

(1) 如 果 父 进程 可 能 先 于 子 进程 结束 ， 进 程 的 部 分 输出 可 能 在 命令 提示 串 后 ， 比 如 本 例 的 一 种 
可 能 输出 结果 是 abcan@ubuntu:~$ed， 实 际 输出 串 abed 被 命令 提示 串 can@ubuntu:~$ 隔 开 。 

(2) 在 同一 系统 环境 下 , 由 于 处 理 器 调度 策略 固定 , 也 许 只 能 看 到 一 种 输出 顺序 , 但 如 果 在 printf 
前 添加 一 条 usleep 语句 ， 使 执行 时 间 稍 作 延 迟 ， 则 可 能 看 到 各 种 不 同 的 执行 顺序 。 

在 前 面 的 两 个 示例 中 ， 虽 然 不 同 进程 的 输出 交织 在 一 起 ， 但 各 进程 的 输出 结果 并 未 相互 影响 ， 
后 面 我 们 会 看 到 因 进 程 活动 并 发 执行 而 导致 运行 结果 不 确定 甚至 错误 的 示例 。 

绪 思考 与 练习 题 5.14 画 出 以 下 程序 的 并 发 关系 图 ， 分 析 有 哪些 可 能 的 输出 序列 。 
intmain0 


(ok0—0) { 
printf Ca"); 


下 面 考 虑 一 般 情况 。 假设 两 个 并 发 进程 P1、P2 分 别 有 操 作 序列 S1、S2、..…、Sn 和 TI1、T2、.…、 
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Tm, 每 个 操作 可 能 是 一 行 代码 、 一 个 函数 调用 或 一 个 语句 块 。 由 于 进程 优先 级 、 中 断 和 调度 策略 等 
因素 的 影响 ，S1 可 以 在 Tl 前 执行 ， 也 可 以 在 Tm 后 执行 ， 因 此 两 个 进程 的 操作 序列 可 按 任 何 顺序 
交错 执行 (但 如 果 一 些 操作 还 能 分 解 成 若干 个 子 操作 的 话 , 两 个 并 发 操作 的 子 操作 之 间 还 可 以 交错 执 
行 ， 在 此 暂 不 考虑 这 种 情况 )。 根 据 排列 组 合理 论 ， 若 在 单 处 理 器 系统 上 执行 mtn 个 操作 ， 则 它们 
并 发 执行 的 顺序 有 Cw,, 种 ， 较 小 的 m、n 值 即 可 有 很 多 执行 顺序 模式 。 有 些 模式 会 得 到 正确 的 运行 
结果 ， 有 些 模式 可 能 会 导致 错误 结果 。 为 此 ， 用 户 程序 有 必要 借助 操作 系统 提供 的 机 制 ， 对 并 发 进 
程 的 活动 进行 协调 ， 在 避免 导致 错误 结果 的 顺序 模式 条 件 下 ， 使 程序 并 发 度 尽 可 能 大 。 


5.3.3 ”进程 的 终止 与 回收 


1. 终止 进程 


一 个 进程 完成 其 处 理 任务 或 非 正常 结束 时 ， 会 归还 分 配给 其 程序 代码 与 数据 变量 的 存储 器 资源 
及 所 有 其 他 资源 。 进 程 有 正常 终止 和 异常 终止 两 种 方式 。 

正常 终止 有 完成 main 函数 执行 、 在 main 函数 中 执行 retum 而 返回 、 执 行 exit 函数 调用 而 结束 
三 种 情况 。 正 常 终止 的 进程 会 自动 关闭 所 有 打开 的 文件 ， 防 止 数据 丢失 。 

异常 终止 是 指 因 执 行 abort 函数 调用 、 用 户 按 CaltC 键 、 程 序 执行 出 错 或 收 到 信号 而 终止 。 异 
常 终止 方式 将 在 “信号 机 制 ” 部 分 进行 深入 讨论 。 

这 里 先 介 绍 进程 终止 系统 调用 函数 : 


其 中 ，exit 是 最 常用 的 终止 函数 ， 参 数 status 是 终止 状态 ， 值 为 0 表示 进程 正常 结束 ， 值 为 非 0 
表示 进程 非 正常 终止 或 出 错 。abort 函数 用 于 在 程序 检 出 错误 之 后 主动 终止 进程 , 属于 进程 异常 终止 。 
调用 exit 函数 和 abort 函数 都 会 正常 关闭 所 有 打开 的 文件 ， 归 还 其 他 系统 资源 ， 是 十 分 优雅 的 终止 
方式 。 

不 管 进程 以 何 种 方式 终止 ， 系 统 都 会 在 进程 控制 块 PCB 中 记录 终止 状态 ， 供 父 进程 、 系 统 或 用 
户 查 阅 , 进程 终止 状态 status 由 进程 最 后 调用 的 exit(status)、returm status 或 其 他 函数 调用 的 返回 值 给 
出 。 一 般 情 况 下 ， 终 止 状态 为 0 表示 子 进 程 正常 终止 ， 终 止 状态 为 非 0 表示 进程 非 正常 终止 。abort 
与 信号 在 导致 进程 终止 时 都 会 设置 特定 的 终止 状态 。 进程 常用 的 终止 状态 及 原因 描述 如 表 5-1 所 示 。 


表 5-1 Linux 进程 的 常见 终止 状态 


代码 描述 代码 描述 

0 | 命令 成 功 完 成 Ts 无 效 的 退出 参数 

126 | 命令 无 法 执行 128ix 使 用 Linux 信号 的 致命 错误 
127 | 没有 找到 命令 130 使 用 CaitC 终止 进程 


进程 终止 状态 可 在 命令 结束 后 ， 立 即 用 一 条 命令 echo $? 来 显示 ， 因 为 环境 变量 8? 中 保存 了 当前 
终端 窗口 中 刚 结束 命令 的 退出 状态 。 要 在 程序 中 读 取 进 程 终止 状态 ， 可 由 父 进 程 调用 函数 waitpid 
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假设 exitstatusl.c 的 内 容 为 “int mainO{ exit(100):}”。 

Sgcc -0 exitstatus exitstatus.c 

$ /exitstatus 

S$ echo $2 

100 

为 保证 系统 中 的 所 有 进程 都 有 唯一 正常 的 父 进程 ， 当 父 进程 已 经 终止 而 子 进程 仍然 健在 时 ， 系 
统 会 将 其 子 进程 的 父 进程 改 为 1 号 进程 ，getppid 函数 调用 的 返回 值 为 1。 


2. 进程 僵尸 问题 


Linux 系统 中 的 父 进程 通过 调用 函数 waitpid 来 读 取 已 终止 子 进程 的 退出 状态 ， 该 函数 的 另外 一 
项 重要 工作 是 对 子 进程 进行 最 后 的 清理 。 因 为 进程 终止 后 尽管 已 经 将 大 部 分 资源 归还 给 系统 ， 但 仍 
占用 进程 PPD， 保 留 其 进程 控制 块 PCB， 其 中 包含 退出 状态 和 一 些 对 父 进程 有 用 的 其 他 信息 。 我 们 
称 已 经 执行 结束 但 PCB 仍 存在 的 进程 为 僵尸 进程 ， 僵 尸 进程 虽然 有 PCB， 但 已 经 不 可 能 再 次 运行 。 
父 进程 执行 waitpid 函数 ， 在 读 走 子 进程 退出 状态 和 其 他 信息 后 ， 就 将 其 PCB 清理 掉 ， 让 子 进 程 彻 
底 消 失 ， 完 成 对 已 结束 子 进程 的 善后 处 理工 作 。 
下 面 的 示例 程序 中 , 子 进程 结束 后 ， 由 于 父 进 程 尚未 对 其 做 清理 工作 ， 就 可 通过 ps 命令 看 到 处 
于 僵尸 进程 的 子 进程 ， 进 程 状态 显示 为 Z 或 <defunct>。 
下 面 的 程序 zombie.c 是 一 个 产生 伪 尸 进程 的 示例 : 父 进程 执行 while(1) 死 循环 ， 子 进程 很 快 终 
止 ， 父 进程 尚未 结束 ， 子 进程 成 为 僵尸 进程 。 
店 zombie.c 源 代码 */ 
1  #include <stdioh> 
2  #include <stdlib.h> 
3  #include <unistdh> 
4 #include <sysftypesh> 
5 #inchde <sys/waith> 
6 
全 
8 


intmain0 
{ 
pid tpid; 
9 pid =forkO:; 


11 这 pid 一 0){ 

12 printf("child..\n"): 
13 Jelse { 

14 Printf"parent..\n"):; 
15 while(1): 

16 } 

7 Tetum 0; 

1 


现在 ， 在 第 一 个 终端 窗口 中 编译 执行 该 程序 : 


Sgcec -0 zombie zombie.c 
$ /zombie 
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同时 打开 第 二 个 终端 窗口 ， 查 看 当前 用 户 进程 列表 : 


Sps -nu 
Waming: bad ps syntax. perhaps a bogus '-? See http://procps.sf.net/faq.html 
USER PD %CPU %MEM VSZ RSSTIY STAT START TIMECOMMAND 


15142 1.0 LY 5784 2992pts/1 Ss 23:42 0:00 bash 
15160 0.0 04 2648 1028pts/1 R+ 23:42 0:00ps-u 


can 5895 0.0 I 5848 2976pts/0 Ss 23:19 0:00 bash 

can 5914 0.1 8.4 78880 21696pts0 S 23:19 0:02 gedit exectestl 

can 15134 98.5 0.1 1568 ”332 pts0 R+ 23:42 0:11 /zombie 

can 15135 0.0 00 0 0pts/0 Z+ 23:42 0:00 [zombie] <defunct> 
can 

can 


进程 名 为 “[zombie] <defunct>” 的 进程 就 是 僵尸 进程 ，<defunct> 是 僵尸 状态 ( 即 终止 状态 ) 的 标 


3. 回收 进程 
父 进程 用 调用 函数 waitpid 等 待 子 进程 结束 、 读 出 其 终止 状态 ， 并 对 僵尸 子 进程 进行 最 后 清理 ， 
#include <sys/types.h> 
#include <sys/wait h> 
pid twaitpid(pid tpid, int *status , int options); 
返回 值 ， 如 果 成 功 ， 则 为 子 进程 的 PID; 如 果 出 错 ， 则 为 -1。 


pid_t wait(int *status); 


返回 值 ， 如 果 成 功 ， 则 为 子 进程 的 PID; 如 果 出 错 ， 则 为 -1。 
当 options 的 默认 值 是 0 时 ， 表 示 waitpid 挂 起 调用 进程 的 执行 ， 直 到 其 等 待 集合 中 的 一 个 子 进 

程 终止 。 如 果 等 待 集合 中 的 一 个 进程 在 刚 调用 的 时 刻 就 已 经 终止 ， 那 么 waitpid 就 立即 返回 。 这 两 
种 情况 下 ，waitpid 返回 导致 waitpid 返回 的 已 终止 子 进程 的 PID， 并且 将 这 个 已 终止 的 子 进程 从 系 
统 中 清除 。 

(1) 判定 等 待 集合 的 成 员 

等 待 集合 的 成 员 是 由 参数 pid 来 确定 的 : 

e 如果 pid>0， 那 么 等 待 集合 就 是 一 个 单独 的 子 进程 ，pid 是 进程 PID。 

e 如 果 pid= - 1， 那 么 等 待 集合 就 是 父 进程 所 有 的 子 进程 。 

(2) 检查 已 回收 子 进程 的 退出 状态 

如 果 status 参数 非 空 ， 那 么 waitpid 就 会 在 status 参数 中 放 上 终止 子 进程 的 状态 信息 。 下 面 是 与 

该 参数 相关 的 几 个 常用 宏 。 
WIFEXITED(status): 如 果子 进程 通过 调用 exit 或 一 条 返回 语句 (retum) 正 常 终止 , 就 返回 真 。 
WEXITSTATUS(status): 返回 正常 终止 的 子 进程 的 终止 状态 .只 有 在 WIFEXITED 返回 真 时 ， 
才 会 定义 这 个 状态 。 
e WIFSIGNALED(status): 如 果子 进程 是 因为 一 个 信号 而 终止 的 ， 那 么 就 返回 真 (本 章 后 面 介 

绍 信号 的 概念 )。 
e@ WTERMSIG(status): 返回 导致 子 进程 终止 的 信号 编号 。 只 有 在 WIFSIGNALED(status) 返 回 

真 时 ， 才 定义 这 个 状态 。 
G) 错误 条 件 
如 果 调 用 进程 没有 子 进程 终止 ， 则 waitpid 返回 - 1， 并 且 设置 ermo 为 ECHILD。 如 果 waitpid 
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被 信号 中 断 ， 那 么 它 返回 - 1， 并 设置 ermo 为 EINTR。 

wait 函数 是 waitpid 函数 的 简化 版 本 ， 调 用 wait(&status) 等 价 于 调用 waitpid( - 1, &status, 0)， 表 
示 等 待 任何 子 进程 终止 ， 并 返回 进程 的 PID 号， 并 将 进程 终止 状态 保存 到 变量 status 中 。 

waitpid.c 是 使 用 waitpid 函数 回收 僵尸 子 进程 的 一 个 示例 。 父 进程 在 第 11 行 创建 N 个 子 进程 ， 
将 子 进程 PID 保存 在 父 进程 数组 pid[] 中 ; 在 第 12 行 ， 每 个 子 进程 调用 exit0 函 数 ， 以 唯一 的 退出 状 
态 终止 (请 确定 已 经 理解 为 什么 每 个 子 进程 会 执行 第 12 行 ， 而 父 进 程 不 会 )。 父 进程 在 第 16 行 以 
waitpid 返回 值 作为 while 循环 的 测试 条 件 ， 等 待 其 子 进程 终止 。 第 一 个 参数 为 - 1， 表 示 waitpid 调 
用 阻塞 ， 等 待 任意 子 进程 终止 。 一 旦 有 子 进程 终止 ，waitpid 调用 立即 返回 , 返回 值 为 该 子 进程 PD。 
父 进程 在 第 17 行 检 查 子 进程 的 退出 状态 。 如 果子 进程 是 正常 终止 的 (本 例 是 通过 调用 exit 函数 终止 
的 )， 那 么 父 进程 就 在 第 19 行 提取 终止 状态 ， 输 出 到 终端 窗口 。 当 回收 完 所 有 子 进程 之 后 ， 再 调用 
waitpid 就 会 返回 - 1， 并 且 设 置 ermo 为 ECHILD。 第 25 行 核实 waitpid 函数 是 正常 终止 的 ， 否 则 就 
输出 一 条 错误 消息 。 


访 waitpidc 源 代 码 */ 


2 


#include "wrapper.h" 
#define N 2 


int main() 
{ 
int status, i; 


Pid_tpid[N], retpid; 


店 父 进程 创建 N 个 子 进程 */ 
for(i=0;i<N;it+) 
让 (pid 四 =fork0) 一 0) 信子 进程 */ 
EXit(l = 


族 父 进程 按 序 回收 子 进程 ， 全 部 子 进程 处 理 完毕 后 waitpid 返回 - 1 */ 
while ((retpid = waitpid(-1, &status. 0)) > 0) { 
if (WIFEXITED(status)) 
printf"child %d terminated With exit status=96d\n", 
retpid, WEXITSTATUS(status)): 
else 
printf"child %d terminated abnormally\n", retpid): 
} 


族 全 部 子 进程 处 理 完毕 ，waitpid 从 循环 中 正常 退出 ，ermo 应 该 为 ECHILD */ 
让 (emo 二 ECHILD) 
Perror("waitpid error"): 


exit(0): 
} 


在 我 们 的 Linux 系统 上 运行 这 个 程序 时 ， 会 产生 如 下 输出 : 


\$ /waitpid 
child 22966 terminated normally with exit status=100 
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child 22967 terminated normally with exit status=101 

输出 结果 中 ， 进 程 PID 为 第 16 行 waitpid 的 返回 值 ，status 状态 值 是 子 进程 在 第 12 行 通过 exit 
函数 调用 指定 的 ， 父 进程 在 第 16 行 通过 watipid 将 其 读 取 到 status 变量 中 。 由 于 status 还 包含 除 终止 
状态 外 的 其 他 信息 ， 父 进程 需要 在 第 19 行 通过 宏 WEXITSTATUS 提取 出 来 。 
条 ”思考 与 练习 题 5.15 考虑 下 面 的 程序 waitprob.c。 

intmain0 


{ 


int status: 
pid tpid: 


Printf("Hellon"): 

Pid = forkO: 

printf("%d\n", !pid): 

if(pid =0){ 
if (waitpid(-1, &status, 0) > 0) { 

if(WIFEXITED!(status) 二 0) 
printf("%d\n", WEXITSTATUSGstatus)): 

} 

} 

Printf(“Bye\n"); 

exit(2); 

} 


这 个 程序 会 产生 多 少 输出 行 2? 有 几 种 不 同 的 输出 顺序 ， 并 给 出 所 有 可 能 的 输出 结果 。 


5.3.4 ”让 进程 休眠 
sleep 函数 将 一 个 进程 挂 起 一 段 指 定 的 时 间 : 
#include <unistd h> 


unsigned int sleep(unsigned int secs); 
返回 值 ， 还 要 休眠 的 秒 数 。 


如 果 请 求 的 时 间 到 了 ，sleep 函数 返回 0， 否 则 返回 剩余 休眠 的 秒 数 。 后 一 种 情况 是 可 能 的 ， 因 
为 sleep 函数 可 被 一 个 信号 中 断 而 提前 返回 ， 信 号 的 概念 将 在 5.4 节 详 细 讨 论 。 如 果 仅 希望 挂 起 时 间 
更 加 精确 ， 可 使 用 usleep 函数 ， 它 让 进程 睡眠 若干 微妙 : 


#include <unistd h> 
void usleep(unsigned int usecs); 
返回 值 ; 无 。 
另 一 个 很 有 用 的 函数 是 pause， 该 函数 让 调用 函数 休眠 ， 直 到 该 进程 收 到 一 个 信号 。 
#include <unistdh> 
int pause(void); 
返回 值 ， 总 是 返回 -1。 


gs 思考 与 练习 题 5.16 编写 sleep 的 包装 函数 ， 叫 作 snooze， 它 带 有 下 面 的 接口 。 


unsigned int snooze(unsigned int secs): 
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snooze 函数 除了 会 打印 出 一 条 信息 来 描述 进程 实际 休眠 了 多 长 时 间 外 , 它 和 sleep 函数 的 行 
为 完全 一 样 : 

Slept for 4 of 5 secs. 
5.3.5 ”加 载 并 运行 程序 

execve 函数 在 当前 进程 的 上 下 文中 加 载 并 运行 一 个 新 的 程序 。 


#include <unistdh> 
int execve(const char *filename. const char *argv[] . const char *envp[] ) : 


int execvp(const char *filename, const char *argv[]) ; 
int execlp(const char * file,const char * arg.....); 


如 果 成 功 ， 则 不 返回 : 如 果 错 误 ， 则 返回 -1。 

execvp 函数 加 载 并 运行 可 执行 文件 flename， 带 命令 行 参数 列表 argv， 继 承 父 进程 环境 变量 。 
execve 还 带 参数 envp， 用 envp 设 定 的 环境 运行 程序 。 仅 当 出 现 找 不 到 filename 等 错误 时 ， 
execve/execvp 才 会 返回 到 调用 者 ， 否 则 将 当前 进程 的 代码 和 数据 更 换 成 加 载 程序 及 其 数据 ， 永 不 返 
可 。execlp 形式 本 身 包含 命令 行 参数 列表 。 

参数 列表 结构 如 图 5-19 所 示 ，argv 变量 指向 一 个 以 NULL 结尾 的 指针 数组 ， 其 中 每 个 指针 都 
指向 一 个 参数 串 ， 按 照 惯 例 ，argv[0] 是 可 执行 目标 文件 的 名 字 。 环 境 变量 的 列表 也 具有 类 似 数据 结 
构 ， 如 图 5-20 所 示 。envp 变量 指向 一 个 以 NULL 结尾 的 指针 数组 ， 其 中 每 个 指针 指向 一 个 环境 变 
量 串 ， 其 中 每 个 串 都 是 形 如 "NAME=VALUE" 的 名 字 / 值 对 ， 人 允许 改变 子 进程 的 运行 环境 。 


图 5-19 参数 列表 的 组 织 结构 


enwp[] 
envp[0] PWD=/home/guest 
“shell=/bin/bash” 
USER es” 


图 5-20 环境 变量 列表 的 组 织 结构 


在 execve/execvp 加 载 了 filename 之 后 , 就 调用 启动 代码 设置 堆栈 , 然后 将 控制 传递 给 新 程序 的 

main 函数 ，main 函数 的 原型 为 : 
int main(int argc. char **argv. char **envp): 

或 intmainGintarge, char yargv[] .char *envp[]): 

当 main 函数 开始 在 一 个 32 位 的 Linux 进程 中 执行 时 ， 用 户 栈 有 如 图 5-21 所 示 的 组 织 结构 。 如 
果 我 们 从 栈 项 (低地 址 ) 往 栈 项 (高 地 址 ) 观 察 ， 依 次 为 : 

e 首先 是 main 的 栈 帧 ， 它 是 main 函数 调用 的 局 部 变量 。 

e。 接 下 来 是 命令 行 参数 格式 argc、 命 令 行 参数 列表 指针 argv 和 环境 变量 参数 列表 指针 envp。 
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。 再 接 下 来 就 是 命令 行 参 数列 表 argv[] 和 环境 变量 列表 envp[]。 

e 最 后 ， 栈 底 是 命令 行 参数 串 和 环境 变量 串 。 

e 全 局 变量 environ 指向 这 些 指针 中 的 第 一 个 envp[0]。 
0Oxbfffffff 栈 顶 

以 nu] 1 结尾 的 环境 变量 串 “” 发 -~ 


六 -到 以 nul] 结 尾 的 命令 行 参数 串 
未 使 用 
envp[n] 一 NULL 


envp[n-l] 


Tenviron 


argv[argc-1] 


bp 到 argv[0] 


动态 链接 器 变量 


i 
1 

1 

1 enyp 
1 
we argv 

argC 


0xbffffa7c - 
main 的 栈 帧 


栈 底 
5-21 ” 当 一 个 新 的 程序 开始 时 ， 用 户 栈 的 典型 组 织 结构 
UNIX/Linux 提供 了 几 个 函数 来 操作 环境 变量 : 


#include <stdlib.h> 
char *getenv(const char *name): 


返回 值 ， 若 存在 ， 则 为 指向 name 的 指针 ， 若 无 匹配 的 ， 则 为 null。 
getenv 函数 在 环境 变量 数组 中 搜索 字符 串 "name=value"。 如 果 找 到 了 ， 就 返回 一 个 指向 value 的 
指针 ， 否 则 就 返回 null。 


#include <stdlib.h> 
int setenv(const char *name, const char *newvalue, int overwrite): 


s 


返回 值 : 若 成 功 ， 则 为 0; 若 失败 ， 则 为 -1。 
Void unsetenv(const char *name); 


返回 值 ; 无 。 
如 果 环 境 变量 数组 包含 一 个 形 如 "name=oldvalue" 的 字符 串 ， 那 么 unsetenv 会 删除 它 ， 而 setenv 
会 用 newvalue 代替 oldvalue， 但 是 只 有 在 overwirte 非 零 时 才 会 这 样 。 如 果 环 境 变 量 name 不 存在 ， 
那么 setenv 就 把 "name=newvalue" 添 加 到 数组 中 。 
寻思 考 与 练习 题 5.17 编写 一 个 名 为 myecho 的 程序 ， 它 打印 出 自己 的 命令 行 参数 和 环境 变量 。 
例如 : 
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envp[ 0]: PWD=/home/can/chap5 
envp[2]: USER=can 


以 下 程序 execl.c 用 execvp 函数 加 载 并 运行 命令 “/bin/ps -o "pid, ppid, pgrp, session, tpgid, 


nm 


Comm 


/execlc 源 代码 */ 
1 int main(void) 
intretpid: 
char *arg[] = {"ps", "-0", "pid.ppid.pgrp.session,tpgid,.comm", NULL}: 
execvp("ps", are); 
Perror("exec ps"); 
exit(1); 


oo eewhmwnb 


现在 编译 执行 该 程序 : 


Sgcec -0 execl execl.c 

$ /execl 

PD PPD PGRP SESS TPGIDCOMMAND 

2844 2832 2844 2844 4479bash 

2902 2844 2902 2844 4479 gedit 

4479 2844 4479 2844 4479ps 

由 于 execl.c 在 当前 进程 上 下 文中 加 载 和 运行 ps， 当前 进程 的 程序 和 数据 被 ps 命令 的 程序 与 数 
据 蔡 换 。execvp 函数 调用 一 旦 执行 成 功 ， 将 永 不 返回 ; 若 返回 ， 则 ps 命令 加 载 必然 失败 ， 因 而 不 用 
检测 返回 值 ， 调 用 perror 函数 直接 输出 错误 提示 即 可 。 如 果 改 用 execlp 函数 加 载 程序 ， 那 么 需要 将 
参数 表 展开 到 实际 参数 中 ， 调 用 格式 为 execlp(("ps"， "ps", "-0", "pid,ppid,pgrp, session, tpgid, comm", 
NULID)。 

exec 函数 族 的 执行 过 程 : 先 归还 系统 分 配给 调用 进程 的 程序 代码 与 数据 集 ( 也 包括 其 他 资源 ) 所 
占 内 存 ， 仅 留 下 进程 控制 块 ， 再 为 指定 的 程序 分 配 内 存 ， 将 代码 与 数据 装载 到 内 存 中 ， 让 新 程序 开 
始 执行 。 这 样 ， 新 程序 及 数据 集 就 替换 调用 进程 中 的 原 有 程序 和 数据 ， 但 进程 PID 保持 不 变 。 
和 思考 与 练习 题 5.18 ” 写 一 个 程序 ， 在 当前 进程 上 下 文中 调用 使 用 execvp 函数 加 载运 行 命令 的 
程序 myecho。 


5.3.6 fork 和 exec 函数 的 应 用 实例 


1. 实现 一 个 简单 Shell 


Shell 和 网 络 服务 器 一 般 都 需要 使 用 fork 和 execve 函数 。Shell 是 一 个 交互 式 的 应 用 程序 ， 它 解 
释 执行 用 户 输入 的 命令 。 常 见 的 Shell 有 csh、tcsh、ksh 和 bash。Shell 每 次 读 入 一 条 命令 ， 就 创建 
进程 并 加 载 执 行 ， 这 个 过 程 反复 进行 。 通 常 Shell 还 会 实现 一 些 内 置 命令 ， 如 quit 等 。shellex.c 展示 
了 一 个 简单 Shell 的 main 例 程 。 该 Shell 打印 一 个 命令 行 提示 符 %， 等 待 用 户 在 stdin 上 输入 命令 ， 
然后 解析 并 执行 该 命令 ， 该 Shell 实现 一 条 内 置 命令 quit， 用 于 终止 该 Shell 进程 。 下 面 是 shellex.c 
的 main 函数 的 源 代码 。 


180 


第 5 章 ， 进 程 管理 与 控制 


人 #shellex.c 的 main 函数 的 源 代码 */ 


1 intmainO 

人 了 

3 char cmdline[MAXLINE]: 此 命令 行 缓冲 区 */ 
4 while(D{ 

5 printft"9696 "): 

6 

7 feets(cmdline, MAXLINE. stdin): 雍 读 取 命令 行 */ 
8 if (feoftstdin)) 

9 exit(0); 

10 

11 execute(cmdline); 序 执行 命令 */ 
12 } 

x 


然后 给 出 shellex.c 的 命令 执行 函数 execute 和 命令 分 析 函 数 parseline0 的 源 代码 。 
语 shellex.c 的 命令 执行 函数 execute 的 源 代码 */ 


1 voidexecute(char *cmdline) 

-| 

3 char argv[MAXARGS]: /# execve 函数 的 参数 表 */ 
4 char buf[ MAXLINE]: 让 保存 修改 后 的 命令 行 */ 
5 int bg; 颇 是 否 在 后 台 执 行 */ 
6 pid_tpid: 启 子 进程 PD */ 

7 

8 strcpy(buf cmdline): 

9 bg = parseline(buf, argv); 上 # 解析 命令 行 */ 

10 f(argv[0] —= NULL) 

11 Tetum; 店 如 果 第 1 个 参数 为 空 ， 则 忽略 命令 */ 
12 

13 if(!builtin command(argv)) { 

14 if((pid=fork0)—=0) { 上 # 创建 子 进程 *#/ 
15 if (execvp(argv[0], argv) <0) { 

16 Printf("%s: Command not found.\n". argv[0)): 

17 exit(0); 

18 } 

19 } 

20 

21 让 (tbg) { 此 前 台 执行 */ 

22 int status; 

23 if (waitpid(pid, &status, 0)< 0) 

24 perror("waitpid error"): 

25 } 

26 else 

27 Printf("%d %s", pid cmdline): 

28 } 

29 Tetum: 

0 

| | 


32 ”上 # 判断 和 执行 内 置 命令 */ 
33 intbuiltin_ command(char **argv) 


181 


} 


if (!stremp(argv{[0]. "exit")) 
exit(0): 

if (!stremp(arev[0]. "&")) 
Tetum 1; 

Tetum 0: 


上 # 内 置 命 令 exit*/ 


店 忽略 由 & 开 始 的 命令 串 */ 


店 非 内 置 命令 */ 


让 shellex.c 的 命令 分 析 函 数 parseline 的 源 代码 */ 


{ 


i 
2 
3 
4 
5 
6 
六 
8 
bE 


10 
11 


29 } 


execute 首先 调用 parseline 函数 ， 解 析 以 实 


int parseline(char *buf char **argvV) 


char *delim: 
int argc; 
int bg; 


buffstlen(bup-1] ="': 
while (*buf && (*buf —'")) 
buf++t; 


店 创建 argv 数 组 */ 
argc =0; 
while ((delim = strehr(buf. '))) { 
argv[argc++] =buf: 
*delim = "\0'; 
buf= delim+ 1; 
while (*buf && (*buf 一 ')) 
buf++; 
} 
argv[argc] = NULL: 


if(argc 一 0) 
Tetum 1; 


上 # 命令 是 否 应 在 后 台 执行 */ 


if((bg=(*arev[argc-1]—'&)) =0) 


argv[--argc]=NULL: 
Tetum bg: 


庆 指向 第 1 个 分 隔 符 */ 
上 # 字符 串 数组 args 中 命令 行 参 数 的 个 数 */ 
庆 后 台 作业 */ 


上 # 用 空格 蔡 换行 末 换行 符 */ 
此 删除 行 首 空格 */ 


上 # 忽略 空格 ， 查 找 下 一 个 参数 的 起 始 位 置 */ 


上 忽略 空 行 */ 


空格 分 隔 的 命令 行 参数 ， 构 造 命令 行 参 数 数组 argv， 再 


传 给 execve 函数 。 第 一 个 参数 是 命令 名 ， 如 果 是 内 置 命令 ， 就 由 Shell 本 身 执行 ， 如 果 是 可 执行 文 
件 命 令 ，Shell 就 在 一 个 新 的 子 进程 上 下 文中 加 载 并 执行 这 个 命令 。 


如 果 最 后 一 个 参数 是 & 字 符 ， 那 么 parseline 函数 返 加 
待 其 完成 ); 
execute 函数 调用 builtin_ command 函数 解析 命令 行 ， 
内 置 命令 。 如 果 是 , 就 立即 解释 执行 该 命令 并 返回 1, 否则 返回 0。 简单 Shell 只 


否则 返回 0， 表 示 应 该 在 前 台 


1， 表 示 应 该 在 后 台 执 和 
台 执 行 这 个 程序 (Shell 会 等 待 其 完成 )。 

该 函数 根据 第 一 个 命令 行 参数 检查 是 否 是 
有 一 个 内 置 命令 


该 程序 (Shell 不 等 


exit, 


用 于 终止 Shell。 实 际 使 用 的 Shell 一 般 会 有 很 多 内 置 命 令 ， 如 和 和 怨 。 


如 果 builtin_command 函数 返 
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回 0， 那 么 shellex 创建 一 


进程 ， 并 在 子 进程 中 执行 所 请 求 的 
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程序 。 如 果 用 户 要 求 在 后 台 运 行 该 程序 , 那么 shellex 立即 返回 到 循环 的 开始 处 , 等 待 下 一 个 命令 行 。 
否则 ，shellex 使 用 waitpid 函数 等 待 子 进程 终止 。 当 子 进程 终止 时 ，shellex 就 开始 下 一 轮 运 代 。 现 


在 测试 运行 该 程序 : 
Sgcec -0 shellex shellex.c 
$ /shellex 
Yopwad 
/home/guest/work/chap5 
% exif 
$ 


注意 ， 这 个 简单 的 Shell 还 是 存在 缺陷 ， 因 为 它 并 不 回收 它 的 后 台子 进程 。 修 改 这 个 缺陷 需要 


用 到 稍 后 即将 介绍 的 信号 机 制 。 
2. 实现 |/O 重 定向 


将 fork、exec、dup 函数 相 结合 ， 可 以 实现 非常 灵活 的 功能 特性 ，UNIX Shell 的 IO 重 定向 和 管 
道 机 制 都 是 这 样 实现 的 。 这 里 讨论 IO 重 定向 的 实现 原理 ， 有 助 于 我 们 在 程序 中 实现 相似 的 功能 。 

exec2.c 是 一 个 输入 重 定向 示例 程序 ， 父 进程 显示 命令 提示 符 %6， 从 标准 输入 读 入 重 定向 命令 串 
“sort < /etc/passwd”; 创建 子 进程 ， 将 其 标准 输入 重 定向 到 文件 /etc/passwd， 子 进程 加 载 和 执行 sort 


命令 ， 实 现 对 文件 的 排序 功能 。 


让 exec2.c 源 代码 */ 
int main(void) 
{ 
int ret.pid,fd:; 


1 
2 

3 

4 char arg0[20]. arg1[20], arg2[20]: 店 用 于 接收 命令 参数 的 数组 变量 */ 

S 上 # 假定 读 入 数据 为 : arg0[]="sort", argl[ 二 "<",arg2[]="etcipasswd" */ 

6 printf"%6%"); 。 ”让 先 打印 提示 符 ， 在 printf 函数 中 ， 输 出 一 个 % 要 写 两 个 % */ 
7 scanft"%bs%0s%s"arg0,argl,arg2);。。 /#* 从 标准 输入 读 入 重 定向 命令 */ 

8 


9 pid=fork0; 

10 让 (pid 一 0) { 

11 人 fd-open(arg2.O RDONLY.0): 

12 close(0); 户 关闭 标准 输入 */ 

13 dup(fd); 证 将 乌 中 的 文件 指针 复制 到 描述 符 0 对 
14 上 # 这 样子 进程 的 标准 输入 被 重 定向 到 文件 /etc/passwd */ 
15 execlp(areg0, arg0, NULL): 

16 } 

17 else { 

18 wait(NULL): 

19 } 

0 3} 

程序 的 编译 和 执行 过 程 如 下 : 

Sgcc -0 erec2 exec2.c 

$ /exec2 


%sort < /etcpasswd 
avahi-autoipd:x:105:113:Avahi autoip daemon...:/var/lib/avahi-autoipd:/bin/false 
avahi:x:111:117:Avahi mDNS daemon...:/var/run/avahi-daemon:/bin/false 
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条” 思考 与 练习 题 5.19 ”编写 一 个 程序 , 创建 子 进 程 以 执行 用 户 输入 的 输出 重 定向 命令 “ls > 
ls.out” 的 功能 。 


*5.3.7” 非 本 地 跳 转 


C 语言 提供 了 一 种 用 户 级 异常 控制 流 形式 ， 称 为 非 本 地 跳 转 。 它 将 控制 直接 从 一 个 函数 转移 到 
另 一 个 当前 正在 执行 的 函数 ， 而 不 需要 经 过 正常 的 调用 /返回 序列 。 非 本 地 跳 转 是 通过 setimp 和 
longjmp 函数 来 提供 的 。 

#include <setjmp.h> 


int setjmp(jmp_buf env): 
int sigsetjmp(sigjmp buf env, int savesigs); 


返回 值 ，setjmp 返回 0，longjmp 返回 非 零 值 。 
setjmp 函数 在 env 缓冲 区 中 保存 当前 调用 环境 ， 以 供 longjmp 函数 使 用 ， 并 返回 0。 调 用 环境 包 
括 程序 计数 器 、 栈 指针 和 通用 目的 寄存 器 。 
#include <setimp h> 
void longjmp(jmp_buf env, intretval); 
void siglongjmp(sigjmp_buf env, int retval); 


返回 值 ， 从 不 返回 。 

longjmp 函数 从 env 缓冲 区 中 恢复 调用 环境 ， 然 后 触发 从 最 近 一 次 初始 化 env 的 一 个 setjmp 调 
用 返回 。 然 后 setjimp 函数 返回 ， 并 带 有 非 零 的 返回 值 retval。 

setjmp 函数 仅 被 调用 一 次 ， 但 返回 多 次 : 一 次 是 当 第 一 次 调用 setimp， 而 调用 环境 保存 在 缓冲 
区 env 中 时 ; 一 次 是 为 每 个 相应 的 longjmp 调用 。longjmp 函数 被 调用 一 次 , 但 从 不 返回 。 非 本 地 跳 
转 的 一 个 重要 应 用 就 是 允许 从 一 个 深层 嵌 套 的 函数 调用 中 立即 返回 ， 通 常 是 由 检测 到 某 个 错误 情况 
引起 的 。 如 果 在 一 个 深层 嵌 套 的 函数 调用 中 发 现 一 个 错误 ， 我 们 可 以 使 用 非 本 地 跳 转 直接 返回 到 一 
个 普通 的 本 地 化 错误 处 理 程序 ， 而 不 是 费力 地 解 开 调 用 栈 。 

在 示例 程序 setjmp.c 中 , main 函数 首先 调用 setjmp 以 保存 当前 的 调用 环境 , 然后 调用 函数 fanl， 
funl 依次 调用 函数 fun2。 如 果 funl 或 fnn2 遇 到 错误 ， 它 们 立即 通过 一 次 longjmp 调用 从 setjmp 返 
可 。setimp 的 非 零 返回 值 指明 了 错误 类 型 ， 可 据 此 进行 解码 ， 再 在 代码 的 某 个 位 置 进行 处 理 。 


/# setjimp.c 源 代码 */ 
1 jmp bufbuf 


2 interorl=0,emror2=1; 

区 void fun1(void), fun2(void): 

4 intmain) 

5 { 

6 intrc: 

了 rc =setjimp(buD): 

8 if 人 ce 一 0) 

9 fun10:; 

10 elseif(rc—1) 

11 printf(“Detected an errorl condition in foo\n"): 
i elseif (rc—2) 

13 Printf("Detected an error2 condition in foo\n"): 
14 else 

Li printf"Unknown error condition in foo\n"): 
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exit(0): 


17 了 了 


19 void funl(void) 


20 { 


2 


Hf(errorl) 
longjmp(buf. 1): 
fon20: 


26 void fun2(void) 


pg 


30 3 


if(error?2) 
longjmp(buf 2); 


非 本 地 跳 转 还 可 使 信号 处 理 程序 跳 转 到 特殊 的 代码 位 置 ， 而 非 返回 到 被 信号 中 断 的 指令 位 置 。 
restartc 示例 程序 用 信号 和 非 本 地 跳 转 实现 了 一 种 特性 ， 允 许 用 户 在 键入 CtltC 时 实现 软 重启 。 
sigsetjmp 和 siglongjmp 函数 是 setjmp 和 longjmp 的 可 以 在 信号 处 理 程序 中 使 用 的 版 本 。 


* restart.c 


2 
3 
4 
Se 
6 
8 
8 
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源 代码 所 


sigjmp_buf buf: 
void handler(int sig) {siglongjmp(buf 1):} 


int mainO 


signal(SIGINT., handler): 

让 (tsigsetmp(buf 1)) 
Printf("starting\n"); 

else 
printf("restarting\n"); 


while(D) { 
sleep(1); 
Printf("processing..\n"): 
} 
exit(0); 


程序 第 一 次 启动 时 ， 对 sigsetjmp 函数 的 初始 调用 保存 调用 环境 和 信号 的 上 下 文 (包括 待 处 理 的 
和 被 阻塞 的 信号 向 量 )。 随 后 ，main 函数 进入 一 个 无 限 处 理 循 环 。 当 用 户 键入 CalHC 时 ，Shell 发 送 
一 个 SIGINT 信号 给 这 个 进程 。 进程 捕获 这 个 信号 , 信号 处 理 程序 执行 非 本 地 跳 转 , 使 控制 回 到 main 
函数 的 开始 处 。 程 序 输出 如 下 : 


$ /estart 
starting 
processing 
processing 
Testarting 
processing 
Testarting 
processing 


# 用 户 输入 CalC 


# 用 户 输入 CrthC 
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5.3.8 进程 与 程序 的 区 别 


了 解 进程 的 概念 后 ， 现 在 停 下 来 ， 确 认 一 下 你 理解 了 程序 和 进程 之 间 的 区 别 

(1) 程序 是 永存 的 ， 作 为 源 代码 或 目标 模块 存在 于 外 存 中 ， 进 程 是 暂时 的 ， 是 程序 在 数据 集 上 
的 一 次 执行 ， 有 创建 ， 有 撤销 ， 存 在 是 暂时 的 。 

(2) 程序 是 静态 的 ， 关 机 后 仍然 存在 ， 进 程 是 动态 的 ， 有 从 产生 到 消亡 的 生命 周期 。 

(3) 进程 具有 并 发 性 ， 而 程序 没有 。 

(4) 进程 和 程序 不 是 一 一 对 应 的 : 一 个 程序 可 对 应 多 个 进程 ， 即 多 个 进程 可 执行 同一 程序 ; 一 
个 进程 可 以 执行 一 个 或 多 个 程序 。 


信号 机 制 


进程 在 运行 过 程 中 有 很 多 突 发 事件 需要 做 应 急 处 理 ， 比 如 子 进程 终止 、 程 序 暂停 命令 、 进 程 终 
止 命令 ， 这 些 事件 都 要 求 进程 及 时 处 理 ， 保 证 进程 以 可 控 的 期 望 方式 正常 运行 。UNIX 系统 提供 了 
信号 机 制 ， 让 进程 在 正常 工作 过 程 中 ， 能 时 刻 侦 听 和 及 时 处 理 与 其 相关 的 各 种 应 急事 件 。 


5.4.1 ”信号 概念 


回顾 “计算 机 组 成 原理 ”课程 讲 过 的 知识 可 知 ， 几 乎 所 有 CPU 都 有 中 断 机 制 ， 在 不 影响 当前 程 
序 运 行 的 情况 下 ， 及 时 处 理 CPU 层面 上 的 外 部 应 急事 件 ， 如 用 户 击 键 、 网 络 分 组 到 达 、 电 源 故 障 。 
当 发 生 外 部 事件 时 ， 相 关 部 件 (键盘 、 网 卡 、 串 口 、A/D 模块 等 ) 会 发 出 一 个 信号 。CPU 接收 到 中 断 
信号 后 ， 会 立即 暂停 当前 正在 执行 的 程序 代码 ， 保 存 上 下 文 ， 转 去 执行 中 断 处 理 程序 ， 处 理事 件 (如 
查询 与 记录 按键 、 取 走 网 络 分 组 、 保 存 当前 工作 )， 再 返回 到 原来 断 点 处 执行 。 

信号 机 制 是 在 进程 层面 上 对 CPU 中 断 机 制 的 一 种 模拟 , 信号 就 是 一 条 小 消息 , 它 通知 进程 系统 
中 发 生 了 与 该 进程 相关 的 某 种 事件 。 这 些 事件 可 能 来 自 于 用 户 操作 、 内 核 、 本 进程 或 其 他 进程 。 每 
种 信号 用 1~31 或 1~63 的 一 个 整数 表示 ， 未 处 理 的 信号 用 一 个 32 位 或 64 位 的 整 型 变量 记录 ， 每 种 
信号 对 应 其 中 一 个 二 进 制 位 。 进 程 收 到 某 个 信号 后 ， 都 要 执行 某 种 操作 (或 某 个 程序 ) 以 对 其 进行 处 
理 ， 默 认 处 理 方式 一 般 有 忽略 和 终止 两 种 ， 用 户 可 设置 信号 处 理 函 数 ， 以 按 要 求 进行 信号 处 理 。 

表 5-2 展示 了 Linux 系统 上 支持 的 30 种 不 同类 型 的 信号 。 在 终端 窗口 中 输入 “man7 signal” 就 
能 得 到 这 个 列表 。 


表 5-2 UNIXLinux 信号 种 类 


序号 信号 名 信号 意义 默认 处 理 方式 
第 一 类 : 按键 控制 信号 
01l SIGHUP 进程 的 控制 终端 和 控制 进程 已 结束 终止 进程 
02 SIGINT 用 户 键入 CuHC 键 终止 进程 
03 | seour | 从 刍 间 发 出 的 终止 (Qui0 信 号 | 终止 进 程 、core 转 储 () 
20 SIGTSTP 用 户 键入 CuHzZ 键 暂停 进程 
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( 续 表 ) 
序号 信号 名 信号 意义 默认 处 理 方式 
第 二 类 ; 命令 控制 信号 
09 SIGKILL 强制 进程 终止 (此 信号 不 能 屏 项 ) 终止 进程 (2) 
15 SIGTERM 进程 结束 信号 ， 由 kill 命令 产生 终止 进程 
18 SIGCONT 让 暂停 的 进程 继续 执行 进程 暂停 时 继续 运行 
19 SIGSTOP 暂停 (Stop) 进 程 的 执行 暂停 进程 (2) 
第 三 类 ; 运行 出 错 信号 
04 SIGILL 进程 执行 了 非法 指令 并 试图 执行 数据 段 终止 进程 、Core 转 储 (1) 
05 SIGTRAP 跟踪 陷阱 (trace tap)， 执 行 跟踪 代码 终止 进程 、Core 转 储 (1) 
06 SIGIOT 进程 发 生 错误 并 调用 abort 终止 进程 、Core 转 储 (1) 
07 SIGEMT 进程 访问 非法 地 址 、 地 址 对 齐 出 错 等 终止 进程 、Core 转 储 (1) 
08 SIGFPE 浮 点 运算 错误 、 滋 出 、 除 数 为 0 等 终止 进程 、Core 转 储 (1) 
11 SIGSEGV 进程 访问 内 存 越界 ， 无 权限 访问 终止 进程 、Core 转 储 (1) 
13 SIGPIPE 进程 向 无 读者 的 管道 进行 写 操作 终止 进程 
16 SIGSTKFLT 进程 发 现 堆栈 溢出 错误 终止 进程 、Core 转 储 (1) 
第 四 类 : 用 户 自 定义 信号 
10 SIGUSR1 保留 给 用 户 自行 定义 终止 进程 
12 SIGUSR2 保留 给 用 户 自行 定义 终止 进程 
第 五 类 ， 其 他 信号 
14 SIGALRM 时 钟 定 时 信号 。 当 某 进 程 希望 在 某 时 间 后 接收 信号 | 终止 进程 
时 发 出 此 信号 
17 SIGCHLD 子 进程 终止 信号 忽视 
23 SIGURG 套 接 字 (socke0 有 “紧急 ”数据 到 达 忽视 
30 SIGPWR. 系统 电源 失效 终止 进程 


注 : (1) 多 年 前 ， 主 存储 器 是 用 一 种 称 为 磁 芯 存储 器 的 技术 来 实现 的 。“ 转 储存 储 器 ”(dumping 
core) 是 一 个 历史 术语 ， 意 思 是 把 代码 和 数据 存储 器 段 的 映像 写 到 磁盘 上 。 
(2) 这 个 信号 既 不 能 被 捕获 ， 也 不 能 被 忽略 。 


每 种 信号 类 型 都 对 应 某 种 系统 事件 。 低 层 的 硬件 异常 是 由 内 核 异 常 处 理 程序 处 理 的， 正常 情况 
下 ， 对 用 户 进程 而 言 是 不 可 见 的 。 一 些 信号 提供 了 一 种 机 制 ， 通 知 用 户 进程 发 生 了 这 些 异 常 。 比 如 ， 
如 果 一 个 进程 试图 除 以 0, 那么 内 核 就 给 它 发 送 一 个 SIGFPE 信号 (序号 08); 如 果 进 程 执 行 一 条 非法 
指令 ， 内 核 就 给 它 发 送 一 个 SIGILL 信号 (序号 04); 如 果 进 程 发 生 内 存 访问 越界 、 非 法 或 越权 ， 内 
核 就 给 它 发 送 一 个 SIGSEGV 信号 (序号 10)。 其 他 信号 一 般 为 来 自 内 核 或 其 他 进程 的 较 高 层 软件 事 
件 。 比 如 ， 如 果 当 前 进程 在 前 台 运行 ， 在 终端 窗口 中 键入 CtlH+C( 即 同时 按 下 Ctrl 键 和 C 键 )， 内 核 
就 会 给 这 个 前 台 进 程 发 送 一 个 SIGINT 信号 (序号 02); 一 个 进程 可 以 通过 向 另 一 个 进程 发 送 一 个 
SIGKILL 信号 (序号 09) 将 它 强 制 终止 ， 当 一 个 子 进程 终止 时 ， 内 核 会 发 送 一 个 SIGCHLD 信号 (序号 
17) 给 父 进程 。 
犁 ”* 思 考 与 练习 题 5.20 分 别 写 出 一 个 可 能 发 生 内 存 访问 越界 和 被 0 除 的 程序 ， 编 译 运行 该 程序 ， 
观察 错误 输出 描述 。 
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5.4.2 ”信号 术语 


传送 一 个 信号 到 目的 进程 由 两 个 步骤 组 成 : 

e 发 送信 号 。 内 核 通过 更 新 目的 进程 上 下 文中 的 某 个 状态 ， 发 送 ( 递 送 ) 一 个 信号 给 目的 进程 。 
发 送信 号 可 以 有 如 下 两 个 原因 : 1) 内 核 检 测 到 一 个 系统 事件 ， 比 如 被 0 除 错误 或 者 子 进程 终 
止 ; 2) 一 个 进程 调用 了 kill 函数 (下 一 节 讨论 )， 显 式 地 要 求 内 核发 送 一 个 信号 给 目的 进程 。 
一 个 进程 可 以 发 送信 号 给 自己 。 

e 接收 信号 。 当 目的 进程 被 内 核 强迫 以 某 种 方式 对 信号 的 发 送 做 出 反应 时 ， 目 的 进程 就 接收 
了 信号 。 进 程 可 以 忽略 这 个 信号 ， 终 止 或 者 通过 执行 一 个 称 为 信号 处 理 程序 (signal handler) 
的 用 户 态 函 数 来 捕获 这 个 信号 。 图 5-22 给 出 了 信号 处 理 程序 捕获 信号 的 基本 思想 。 


(3) 信号 处 理 
运行 


(4) 从 信号 处 理 程序 
返回 到 进程 的 下 一 条 指令 


5-22 “信号 处 理 过 程 :接收 到 信号 会 触发 控制 转移 到 信号 处 理 程序 ， 在 信号 处 理 程序 完成 处 理 之 后 ， 
将 控制 返回 给 被 中 断 的 程序 

已 经 发 出 但 尚未 被 接收 的 信号 叫 作 待 处 理 信号 (pending signal)。 一 种 信号 类 型 只 能 有 一 个 待 处 理 
信号 。 如 果 进程 已 有 一 个 类 型 为 大 的 待 处 理 信号 ， 其 后 发 送 到 该 进程 的 类 型 为 大 的 信号 不 会 排队 等 
待 ， 而 是 被 简单 丢弃 。 一 个 进程 可 以 有 选择 地 阻塞 接收 某 种 信号 ， 当 某 种 信号 被 阻塞 时 ， 它 仍 可 以 
被 发 送 ， 但 暂时 不 会 被 目的 进程 接收 ， 直 到 该 信号 被 解除 阻塞 。 

一 个 待 处 理 信号 最 多 被 接收 一 次 。 内 核 为 每 个 进程 设置 一 个 pending 位 向 量 记录 待 处 理 信号 的 
集合 ， 设 置 一 个 blocked 位 向 量 记录 被 阻塞 信号 的 集合 ， 这 两 个 字段 都 定义 在 task_struct 结构 体 中 。 
pending 和 block 向 量 一 般 与 机 器 字 长 相同 。 当 发 送 一 个 类 型 为 k 的 信号 时 ， 内 核 就 将 pending 的 第 
k 位 置 1， 而 为 接收 到 一 个 类 型 为 k 的 信号 后 ， 内 核 就 将 pending 的 第 k 位 清 0， 并 调用 信号 处 理 程 
序 ， 称 为 捕获 信号 。 将 执行 信号 处 理 程序 称 为 处 理 信号 。 


5.4.3 ”发 送信 号 的 过 程 

UNIX 系统 提供 了 多 种 向 进程 发 送信 号 的 机 制 。 所 有 这 些 机 制 都 基于 进程 组 (process group) 这 
个 概念 。 

1. 进程 组 概念 


每 个 进程 都 只 属于 一 个 进程 组 ， 进 程 组 有 一 个 正 整数 进程 组 ID。 进 程 组 是 一 个 或 多 个 进程 的 集 
合 ， 通 常 它 们 与 一 组 作业 相关 联 ， 可 以 接收 来 自 同一 终端 的 各 种 信号 。getpgmp 函数 返回 当前 进程 的 
进程 组 ID: 


#include <unistdh> 
Pid t getpgrp(void): 
返回 值 : 调用 进程 的 进程 组 加 。 
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默认 情况 下 , 一 个 子 进程 及 其 父 进程 属于 同一 个 进程 组 。 一 个 进程 可 以 通过 使 用 setpgid 函数 来 
改变 自己 或 其 他 进程 的 进程 组 : 


#include <unistd h> 
int setpgid(pid tpid, pid tpgid): 
返回 值 : 若 成 功 ， 则 为 0， 若 失败 ， 则 为 -1。 


setpgid 函数 将 进程 pid 的 进程 组 改 为 pgid。 如 果 pid 是 0， 那么 就 使 用 当前 进程 的 PID， 即 设置 
当前 进程 的 pgid。 如 果 pgid 是 0, 那么 就 用 pid 指定 的 进程 PID 作为 进程 组 ID。 例 如 ,如 果 进 程 15213 
是 调用 进程 ， 那 么 setpgid(0.0) 会 创建 一 个 新 的 进程 组 ， 其 进程 组 ID 是 15213， 并 且 把 进程 15213 加 
入 到 这 个 新 的 进程 组 中 。 

一 般 使 用 作业 (job) 来 表示 为 了 对 一 个 命令 行 求 值 而 创建 的 进程 。 在 任何 时 刻 ， 最 多 只 有 1 个 前 
台 作业 和 0 个 或 多 个 后 台 作业 。 比 如 ， 键 入 如 下 命令 : 

Sls|sort 

这 会 创建 一 个 由 两 个 进程 组 成 的 前 台 作 业 ， 这 两 个 进程 通过 UNIX 管道 连接 起 来 :一 个 进程 运 
行 ls 程序 ， 另 一 个 进程 运行 sort 程序 。 

2. 用 /bim/kill 程序 发 送信 号 

/bin/kill 程序 可 以 向 另外 的 进程 发 送 任意 信号 。 比 如 ， 如 下 命令 发 送信 号 9(SIGKILLL) 给 进程 
EE 

$kil1 -9 15213 

负 的 PID 会 导致 信号 被 发 送 到 进程 组 PID 中 的 每 个 进程 。 比 如 ， 如 下 命令 发 送 一 个 SIGKILL 
信号 给 进程 组 15213 中 的 每 个 进程 。 


$kill -9 -15213 


3. 从 键盘 发 送信 号 


键入 CtltC 会 导致 一 个 SIGINT 信号 被 发 送 到 这 个 前 台 进 程 组 中 的 每 个 进程 。 默认 处 理 行为 是 
终止 前 台 作 业 。 与 此 类 似 ， 输 入 Ctrl+Z 会 发 送 一 个 SIGTSTP 信号 到 Shell，Shell 捕获 这 个 信号 ， 并 
发 送 SIGTSTP 信号 给 前 台 进 程 组 中 的 每 个 进程 ， 默 认 处 理 行为 是 停止 ( 挂 起 ) 前 台 作业 。 


4. 用 kill 和 raise 函数 发 送信 号 
进程 通过 调用 kill 函数 发 送信 号 给 其 他 进程 或 发 送 者 之 际 , 调用 raise 函数 向 进程 自己 发 送信 号 : 


#include <sys/typesh> 
#include <signal h> 
int kill(pid tpid。 int sig): 
int raise(int sig): 
返回 值 : 若 成 功 ， 则 为 0， 若 失败 ， 则 为 -1。 


如 果 pid 大 于 0， 那 么 kill 函数 发 送信 号 sig 给 进程 pid。 如 果 pid 小 于 0， 那 么 kill 发 送信 号 sig 
给 进程 组 abs(pid) 中 的 每 个 进程 。 在 killer.c 示例 程序 中 ， 父 进程 用 kill 函数 发 送 SIGKILL 信号 给 它 
的 子 进程 。 
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诊 killerc 源 代码 */ 

1 intmain0 

> 

pid tpid: 

4 

有 片 子 进 程 睡眠 ， 直 到 接收 到 SIGKILL 信号 ， 然 后 死 掉 */ 
6 让 (pid=forkO) 一 0){ 

7 pause0: 上 庆 等 待 信号 到 来 */ 

8 Printf("control should never reach herel\n"): 
9 exit(0): 

10 } 

11 

12 证 父 进程 给 子 进程 发 送 SIGKILL 信号 */ 
13 kill(pid, SIGKILL): 

14 exit(0): 

-0 


* 思 考 与 练习 题 5.21 讨论 如 何 修改 killer.c， 让 子 进程 向 父 进程 发 送 SIGKILL 信号 。 
5. 用 alarm 函数 发 送信 号 


进程 可 以 通过 调用 alarm 函数 向 自己 发 送 SIGALRM 信号 。alarm 函数 安排 内 核 在 secs 指定 秒 数 
内 发 送 一 个 SIGALRM 信号 给 调用 进程 ， 相 当 于 给 进程 设置 一 个 闹钟 。 如 果 秒 数 是 0， 那 么 不 会 调 
度 新 的 闹钟 (alarm)。alarm 函数 调用 都 将 取消 任何 待 处 理 闹 钟 , 返回 待 处 理 的 闹钟 在 被 发 送 前 还 剩 下 
的 秒 数 。 如 果 没 有 任何 待 处 理 的 闹钟 ， 就 返回 0。 

下 面 的 示例 程序 alarm.c 安排 自己 在 前 $ 秒 内 被 SIGALRM 信号 每 秒 中 断 一 次 ， 当 收 到 第 6 个 
SIGALRM 信号 时 ， 它 就 终止 。 


族 alarm.c 源 代 码 */ 
1 void handler(int sig) 

2 1{ 

3 static int dings = 0; 

4 Printf("Ding\n"); 

5 if(++dings <5) 

6 alarmm(]): 。 人 * 下 一 个 ALARM 信号 在 1 秒 内 投递 *#/ 
yr else { 

8 Printf(“Dang\n"): 

9 exit(0); 


13 ”intmain0 


15 signal(SIGALRM. handleD: 
16 alarm(1): 上 # 下 一 个 ALARM 信号 在 1 秒 内 投递 *#/ 


18 while (1) { ;} 让 每 次 信号 处 理 结束 后 返回 此 处 */ 
19 exit(0): 
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当 运 行 alarm.e 程序 时 ， 在 6 秒 内 每 秒 输出 一 个 Ding， 最 后 输出 Dang 并 终止 进程 : 


S$ /al arm 
Ding 


Ding 

Ding 

Dang! 

注意 , 程序 alamm.c 使 用 signal 函数 设置 了 一 个 信号 处 理 函数 ， 只 要 进程 收 到 一 个 SIGALRM 信 
号 ， 就 异步 地 调用 该 函数 ， 中 断 main 函数 中 的 无 限 while 循环 。 当 信号 处 理 函数 返回 时 ， 控 制 传递 
回 main 函数 , 它 从 当初 被 信号 到 达 时 中 断 的 地 方 继续 执行 。 设置 和 使 用 信号 处 理 函数 的 方法 在 下 面 
几 节 中 讨论 。 


5.4.4 ”接收 信号 的 过 程 


当 内 核 从 一 个 中 断 或 异常 处 理 程 序 返回 ， 准 备 将 控制 传递 给 进程 p 时 ， 它 会 检查 进程 p 的 未 被 
阻塞 待 处 理 信号 的 集合 (pending&~blocked)。 如 果 这 个 集合 为 空 (通常 情况 下 )， 那 么 内 核 将 控制 传递 
到 进程 p 的 逻辑 控制 流 中 的 下 一 条 指令 (Inext)。 

然而 ， 如 果 集合 非 空 ， 那 么 内 核 选择 集合 中 的 某 个 信号 k( 通 常 是 编号 最 小 的 信号 k)， 并 且 强 制 
进程 p 接收 信号 k。 收 到 这 个 信号 会 触发 进程 的 某 种 行为 。 一 旦 进程 完成 这 个 行为 ， 控 制 就 传递 回 
进程 p 的 逻辑 控制 流 中 的 下 一 条 指令 (Inext)。 每 种 信号 类 型 都 有 预定 义 的 默认 行为 ， 默 认 行 为 一 般 
有 4 种 : 

e 进程 终止 。 

。 进程 终止 并 转 储存 储 器 。 

e。 进程 停止 ， 直到 被 SIGCONT 信号 重启 。 

e 进程 忽略 该 信号 。 

前 面 的 表 5-1 展示 了 与 每 种 信号 类 型 相关 联 的 默认 行为 。 比 如 ， 接 收 到 SIGKILL 信号 的 默认 行 
为 就 是 终止 接收 进程 。 另外， 接收 到 SIGCHLD 信号 的 默认 行为 就 是 忽略 这 个 信号 。 进 程 可 以 通过 
使 用 signal 函数 修改 和 信号 关联 的 默认 行为 。 唯 一 的 例外 是 SIGSTOP 和 SIGKILL 信号 ， 它 们 的 默 
认 行 为 是 不 能 被 修改 。 

#include <signal h> 

typedef void (*sighandler b(int): 

sighandler t signal(int signum, sighandler thandler): 

返回 值 ， 若 成 功 ， 则 为 指向 前 次 处 理 程序 的 指针 ; 若 失 败 ， 则 为 SIG_ERR( 不 设置 ermo)。 
signal 函数 可 以 通过 下 列 三 种 方法 来 改变 和 信号 signum 相关 联 的 行为 : 

e 如果 handler 是 SIG IGN， 那 么 忽略 类 型 为 signum 的 信号 。 

e 如果 handler 是 SIG_ DFL， 那 么 将 类 型 为 signum 的 信号 恢复 为 默认 行为 。 

e 否则 ，handler 就 是 用 户 定义 的 函数 的 地 址 ， 这 个 函数 称 为 信号 处 理 程序 (signal handler)。 只 

要 进程 接收 到 一 个 类 型 为 signum 的 信号 ， 就 会 调用 这 个 程序 。 通 过 把 信号 处 理 程序 的 地 址 
传递 到 signal 函数 ， 可 以 改变 默认 行为 ， 这 叫 作 设置 信号 处 理 程序 。 

当 一 个 进程 捕获 了 一 个 类 型 为 k 的 信号 时 ， 为 信号 k 设置 的 处 理 程序 被 调用 ， 函 数 指针 的 整数 
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参数 被 设置 为 k。 这 个 参数 允许 同一 个 处 理 函 数 捕获 不 同类 型 的 信号 。 当 处 理 程序 执行 其 retum 语 
句 时 ， 控 制 (通常 ) 传 递 回 控制 流 中 进程 被 信号 接收 中 断 位 置 处 的 指令 。 
示例 程序 sigintl.c 捕获 用 户 在 键盘 上 键入 CalHC 时 Shell 发 送 的 SIGINT 信号 。SIGINT 信号 的 
默认 行为 是 立即 终止 进程 。 本 例 将 默认 行为 修改 为 捕获 信号 ， 输 出 一 条 信息 后 终止 该 进程 。 
A#sigintl.c 源 代码 */ 
1 voidhandler(int sig) 尾 SIGINT 信号 处 理 函数 */ 
{ 


printf"You entered Ctr-C\n"); 
exit(0); 
} 
intmain0 
{ 
店 设置 SIGINT 信号 处 理 程序 */ 
10 if (signal(SIGINT, handleD 一 SIG ERR) 
11 Perror("signal error"); 
13 pause0; /* 等 待 接收 一 个 信号 */ 
14 exit(0); 
5 
下 面 编译 执行 该 程序 : 
Sgcec -0 sigintl sigintl.c -L. -Iwrapper 
§ /sigint] 
< 键入 CHHC> 
You entered CtrlHC 
$s 
信号 处 理 函数 的 定义 在 第 1~5 行 。main 函数 在 第 10 和 第 11 行 设置 信号 处 理 程序 然后 进入 休 
眠 状态 ， 直 到 接收 到 一 个 信号 (第 13 行 )。 当 接收 到 SIGINT 信号 时 ， 运 行 信号 处 理 程序 ， 输 出 一 条 
信息 (第 3 行 )， 然 后 终止 这 个 进程 (第 4 行 )。 
信号 处 理 程序 是 计算 机 系统 中 并 发 的 又 一 种 情形 。 信 号 处 理 程序 中 断 main0 函 数 的 执行 ， 类 似 
于 低层 异常 (中 断 ) 处 理 程序 中 断 当前 应 用 程序 的 控制 流 的 方式 。 因 为 信号 处 理 程序 的 逻辑 控制 流 与 
main 函数 的 逻辑 控制 流 重合 ， 信 号 处 理 程序 和 main 函数 并 发 地 运行 。 
好 = 思考 与 练习 题 5.22 编写 程序 ，main 函数 执行 死 循 环 while(1){} 期 间 ， 利 用 ALARM 信号 ， 
每 隔 一 定时 间 打 印 当 前 时 间 。 
粥 思考 与 练习 题 5.23 编写 程序 ，main 函数 执行 while 死 循环 ， 捕 获 SIGINT 信号 ， 允 许 用 户 
误 按 一 次 CtlHHC， 用 户 第 1 次 按 CrHC， 进 程 仅 显示 “CTRL-C pressed the first time”， 当 第 2 
次 按 CtrlHC 时 ， 显 示 “CTRL-C pressed the second time” ， 然 后 结束 进程 。 
弛 ”思考 与 练习 题 5.24 编写 程序 ，main 函数 执行 while 死 循 环 ， 使 得 用 户 在 1 秒 内 连续 按 下 
两 次 CtrltC 才 终 止 进程 。 
有 ”思考 与 练习 题 5.25 下 面 这 个 程序 的 输出 是 什么 ? 
pid t pid: 
int counter = 2: 
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void handlerl(int sig){ 
counter = counter - 1: 
Printf("%d\n", counter): 
fflush(stdout); 
exit(0): 
} 


int mainO { 
signal(SIGUSR1, handlerl 
Printf("%d\n",counter); 
fflush(stdout); 


if((pid-fork0)—0) { 
while(1) {} 

} 
kill(pid, SIGUSR1); 
waitpid(-1, NULL, 0): 
counter = count -1; 
Printf("%d\n",counter); 
exit(0): 

上 


); 


说 明 : fush 函数 用 于 强迫 将 缓冲 区 内 容 输出 到 屏幕 。 


*5.4.5 “信号 处 理 问题 


对 于 只 捕获 一 个 信号 并 终止 的 程序 来 说 ， 信 号 处 理 简单 直接 。 然 而 ， 当 一 个 程序 要 捕获 多 个 信 


号 时 ， 会 产生 一 些 问题 。 


e， 待 处 理 信号 被 阻塞 。UNIX 信号 处 理 程序 通常 会 阻塞 相同 类 型 的 待 处 理 信 号 。 比 如 ， 假 设 一 
个 进程 捕获 了 一 个 SIGINT 信号 后 ， 正 在 执行 SIGINT 处 理 程序 。 如 果 把 另 一 个 SIGINT 信 


号 传递 到 进程 , 这 个 SIGINT 信号 将 变 成 待 处 理 信 号 , 而 且 不 会 被 接收 , 直到 处 理 程序 返 
待 处 理 信号 不 会 排队 等 待 。 每 种 类 型 至 多 有 一 个 待 处 理 信 号 。 因 此 ， 如 果 有 两 个 类 型 为 k 


回 。 


互 


的 信号 传递 到 某 个 进程 ， 而 该 进程 正在 执行 信号 k 的 处 理 程序 ， 则 信号 k 被 阻塞 ， 后 续 的 


信号 k 会 被 简单 丢弃 ， 


而 不 会 排队 等 待 。 


系统 调用 可 以 被 中 断 。 像 read、wait 和 accept 这 样 的 系统 调用 会 阻塞 进程 一 段 较 长 的 时 间 ， 


称 为 慢 速 系统 调用 。 在 某 些 系统 中 ， 当 处 理 程序 捕获 到 一 个 信号 时 ， 被 中 断 的 慢 速 系统 调 


用 在 信号 处 理 程序 返 
EINTR。 


回 时 不 再 继续 ， 而 是 立即 给 用 户 返 回 一 个 错误 条 件 ， 并 将 ermo 设置 为 


现在 用 一 个 示例 程序 来 探讨 信号 处 理 存 在 的 问题 。 在 该 例 中 ， 父 进程 创建 一 些 子 进程 ， 子 进程 
运行 一 段 时 间 后 终止 。 为 避免 在 系统 中 留 下 僵尸 进程 ， 父 进程 必须 回收 所 有 子 进程 。 为 了 让 父 进 


程 在 子 进程 运行 时 做 一 些 其 他 J 


[ 作 ， 利 用 SIGCHLD 处 理 程序 来 回 


终止 。 


示例 程序 signall.c 采用 直观 方式 回收 子 进程 ， 每 次 信号 处 理 回 


收 子 进程 ， 而 非 直 接 等 待 子 进程 


收 一 个 子 进程 。 父 进程 设置 


SIGCHLD 处 理 程序 后 ， 创 建 三 个 子 进程 ， 每 个 子 进程 运行 1 秒 后 终止 。 同 时 ， 父 进程 等 待 来 自 终 


端的 输入 行 ， 随 后 处 理 它 。 


每 个 子 进程 终止 时 ， 内 核 通过 发 送 一 个 SIGCHLD 信号 通知 父 进程 。 父 
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进程 捕获 这 个 SIGCHLD 信号 ， 回 收 一 个 子 进程 ， 并 做 一 些 
然后 返回 。 


他 的 清除 工作 (用 sleep(2) 语 句 模拟 )， 


/#signall.c 源 代 码 */ 
片 该 程序 利用 SIGCHLD 信号 回收 子 进程 ， 但 该 程序 有 缺陷 ， 它 无 法 处 理 信号 阻塞 、 信 号 不 排队 等 待 和 系统 调用 被 中 断 
这 些 情况 */ 


上 #include "wrapper.h" 

4 void handlerl (int sig) 

ee 

4 Pid tpid: 

5 f((pid = waitpid(-1, NULL., 0)) <0) 
6 Perror("waitpid error"); 

7 printf"Handler cleaned child %d\n", (int)pid); 
8 sleep(2); 

多 Tetum; 

101 3 

11 

12 ”intmain0 


驳 必 站 

14 inti mn: 

15 charbufIMAXBUF]: 

16 

于 让 (signal(SIGCHLD,handlerl) 一 SIG_ERR) 

18 Perror("signal error"); 

19 

20 for(i=0;i<3;i) { 

21 站 (fork0 一 0){ 

22 printf("Hello from child %d\n", (int getpidO): 
23 sleep(]): 

24 exit(0); 

25 } 

26 } 

27 

28 上 # 父 进程 等 待 来 自 标准 输入 的 信息 并 进行 处 理 */ 
29 if((n=read(STDIN_FILENO. buf sizeof(buf))) < 0) 
30 Perror("read"):; 

31 

| printf("Parent processing input\n"): 

33 while (1) 由: 

34 exit(0): 

a 

signall.c 程序 虽然 直观 简单 ， 但 在 Linux 系统 上 运行 时 ， 输 出 为 : 
$ /signall 

Hello from child 10330 

Hello from child 10331 

Hello from child 10332 

Handler cleaned child 10330 

Handler cleaned child 10332 
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<CR> 

Parent processing input 

从 结果 中 可 以 发 现 ， 内 核发 送 3 个 SIGCHLD 信号 给 父 进 程 ， 但 是 其 中 只 有 两 个 信号 被 接收 ， 
父 进 程 仅 回 收 两 个 子 进程 。 如 果 挂 起 父 进程 ， 就 可 看 到 ， 实 际 上 子 进程 10321 没有 被 回收 ， 而 是 成 
为 一 个 僵尸 进程 (在 ps 命令 的 输出 中 由 字符 串 "defunct" 表 示 ): 

<CTRL Z> 

Suspend 

Sps 

PD TIY STAT TME COMMAND 

10319 p5 T 0:03 signall 

10321 p5 Z 0:00 signall <definct> 

10323 p5R 0:00ps 

问题 出 在 哪里 呢 ?问题 就 在 于 我 们 的 代码 没有 考虑 信号 可 以 阻塞 和 不 会 排队 等 待 这样 的 情况 。 父 
进程 接收 并 捕获 第 一 个 信号 ， 当 handlerl 还 在 处 理 第 一 个 信号 时 ， 第 二 个 信号 就 被 传送 并 添加 到 待 
处 理 信号 集合 里 。 但 由 于 SIGCHLD 信号 被 SIGCHLD 处 理 程序 阻塞 ， 第 二 个 信号 不 会 被 接收 。 此 
后 不 久 , 当 handlerl 还 在 处 理 第 一 个 信号 时 , 第 三 个 信号 到 达 。 因为 已 经 有 一 个 待 处 理 的 SIGCHLD 
信号 ， 第 三 个 SIGCHLD 信号 会 被 丢弃 。 一 段 时 间 之 后 ， 处 理 程序 返回 ， 内 核 注意 到 有 一 个 待 处 理 
的 SIGCHLD 信号 ， 就 迫使 父 进程 接收 这 个 信号 。 父 进程 捕获 这 个 信号 ， 并 第 二 次 执行 handlerl。 
在 处 理 程序 完成 对 第 二 个 SIGCHLD 信号 的 处 理 之 后 ， 已 经 没有 待 处 理 的 SIGCHLD 信号 了 ， 因 为 
第 三 个 SIGCHLD 信号 的 所 有 信息 都 已 经 丢失 了 。 由 此 ， 在 编程 中 要 注意 : 信号 不 可 用 于 对 进程 中 
发 生 的 事件 计数 。 

为 修正 这 个 问题 ， 我 们 应 有 一 个 认识 ， 存 在 一 个 待 处 理 的 信号 仅 表示 自 进 程 最 后 一 次 接收 某 种 
信号 以 来 ,至 少 有 一 个 该 类 型 的 信号 被 发 送 。 所 以 应 修改 SIGCHLD 人 处理 程序 ,使 得 每 次 SIGCHLD 
处 理 程序 被 调用 时 ， 回 收 尽 可 能 多 的 僵尸 子 进程 。signal2.c 为 修改 后 的 SIGCHLD 处 理 程序 。 当 我 
们 在 Linux 系统 上 运行 signal2 时 ， 它 可 以 正确 地 回收 所 有 的 僵尸 子 进程 : 

族 signal2.c 源 代码 */ 
刻 它 是 signall.c 的 改进 版 本 ， 它 虽然 能 够 解决 信号 阻塞 和 不 会 排队 等 待 的 情况 ， 但 没有 考虑 系统 调用 被 中 断 的 情况 */ 


1 #include "wrapper.h" 

2 voidhandler2(int sig) 

| 

4 pid tpid: 

5 while ((pid = waitpidC1, NULL, 0)) > 0) 

6 printft"Handler cleaned child %d\n". (inbpid): 
if(ermo !=ECHILD) 

8 Perror( waitpid error 

9 sleep(2): 

10 Tetum: 
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加 


自动 重启 被 
方法 是 


33 


f(signal(SIGCHLD, handler?) — SIG_ERR) 


perror("signal error"): 


for (i=0;1<3: 1) { 


让 (ork0 一 0){ 
Printf("Hello from child %d\n", (int)getpidO): 
sleep(1): 
exit(0): 

} 

} 


语 父 进程 等 待 来 自 标准 输入 的 信息 并 进行 处 理 */ 


让 (oa=read(STDIN_FILENO,buf sizeoftbuf))) <0) 
perror("read error"): 


Printf("“Parent processing input\n"); 
while (1) 全: 


} 


exit(0); 


执行 结果 如 下 : 


S$ /signal2 
Hello from child 10420 
Hello from child 10421 
Hello from child 10422 
Handler cleaned child 10420 
Handler cleaned child 10421 
Handler cleaned child 10422 
<CR> 
Parent processing input 


然而 ， 问 题 并 未 完全 解决 。 如 果 在 早期 版 本 的 Solaris 操作 系统 上 运行 signal2 程序 ， 它 会 正确 


一 个 错误 。 


Solaris $ /signal2 

Hello from child 11520 
Hello from child 11521 
Hello from child 11522 
Handler cleaned child 11520 
Handler cleaned child 11521 
Handler cleaned child 11522 
Tead: interrupted system call 


这 又 出 了 什么 问题 呢 ? 原 因 是 在 特定 的 Solaris 系统 上 ， 诸 如 read 这 样 的 慢 速 系统 调用 在 被 信号 
发 送 中 断后 ， 是 不 会 自动 重启 的 ， 在 这 里 read 系统 调用 被 SIGCHLD 中 断 了 。 相 反 ， 和 Linux 系统 


动 


也 回收 所 有 的 僵尸 子 进程 。 然 而 ， 在 从 键盘 上 进行 输入 信息 之 前 ， 被 阻塞 的 read 系统 调用 会 提前 返 


P 断 的 系统 调用 不 同 ， 它 们 会 提前 给 调用 程序 返回 错误 条 件 。 对 于 这 个 问题 的 一 种 处 理 
生 启 系统 调用 ， 比 如 将 signal2.c 的 第 30 和 第 31 行 代码 更 换 为 : 


while (@=read(STDIN_ FILENO.buf sizeof(buf))) <0) 


196 


第 5 章 ”进程 管理 与 控制 


if(erno (=EINTR) 
perror("read error"): 
修改 后 的 程序 名 为 signal3.c， 运 行 结果 表明 修复 了 这 个 问题 。 


*5.4.6 ”可 移植 信号 处 理 


尽管 可 以 通过 编程 手动 重启 signal2.c 中 的 系统 调用 ， 解 决 系统 调用 被 中 断 的 问题 ， 但 会 给 编程 
带 来 极 大 负担 : 到 底 哪些 地 方 需要 手动 启动 系统 调用 呢 ? 这 个 问题 是 由 UNIX 信号 处 理 存 在 的 一 个 
缺陷 导致 的 : 不 同系 统 之 间 ， 信 号 处 理 语义 有 差异 ， 有 的 系统 对 被 中 断 的 慢 速 系 统 调用 进行 重启 ， 
有 的 予以 丢弃 。 为 了 处 理 这 个 问题 , Posix 标准 定义 了 sigaction 函数 ,允许 向 Posix 兼容 的 系统 用 户 ， 
明确 指明 期 望 的 信号 处 理 语义 。 

i 

int sigaction(int signum struct sigaction *act, struct sigaction *oldact): 


返回 值 ; 若 成 功 ， 则 为 0， 若 失败 ， 则 为 -1。 


sigaction 函数 由 于 需要 设置 的 内 容 多 ， 很 多 程序 员 不 太 习 惯 使 用 它 ， 因 而 应 用 不 太 广泛 。 一 种 
编程 人 员 非 常 容易 接受 的 方式 是 为 sigaction 函数 设计 一 个 包装 函数 ， 取 名 为 Signal， 其 调用 方式 与 
signal 函数 的 调用 方式 完全 相同 。 我 们 定义 的 Signal 包装 函数 具有 以 下 语义 : 

(1) 只 有 当前 正 被 处 理 的 信号 类 型 被 阻塞 。 

(2) 信号 不 会 排队 等 待 。 

(3) 只 要 可 能 ， 自 动 重启 被 中 断 的 系统 调用 。 

Signal 包装 函数 的 代码 实现 如 下 : 


个 sigaction 函数 的 包装 函数 Signal.c 的 源 代码 ， 位 于 源 程序 wrapper.c 中 ， 
提供 Posix 兼容 系统 中 的 可 移植 信号 处 理 功能 */ 


1 handler t*Signal(intsignum. handler t*handler) 

2 

struct sigaction action, old_action: 

4 

5 action.sa_handler = handler: 

6 sigemptyset(&action.sa_mask): /# 阻塞 信号 处 理 */ 
了 action.sa_flags= SA_RESTART': /# 如 有 可 能 ， 重 启 系统 调用 */ 
8 

9 if (sigaction(signum., &action. &old_action) <0) 

10 perror("Signal error"): 

11 Tetum (old_action.sa_handler): 


2 

采用 Signal 包装 函数 对 signal2.c 程序 进行 改进 ， 得 到 程序 signal4.c， 可 在 不 同 的 计算 机 系统 上 
获得 可 预测 的 信号 处 理 语义 。 现 在 ， 程 序 在 Solaris 和 Linux 系统 上 都 可 正确 运行 了 ， 不 再 需要 手动 
重启 被 中 断 的 read 系统 调用 。 


入 signal4c 源 代 码 ， 它 使 用 Signal 包装 函数 对 signal2.c 进行 改进 ， 得 到 可 移植 的 信号 处 理 语义 沁 


#include "wrapperh" 
2 ”voidhandler2(intsig) 
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了 

4 pid tpid: 

Si while (pid= waitpid(-1. NULL. 0)) > 0) 

6 printft"Handlerreaped child %d\n", (inbypid): 

7 让 (emmo !=ECHILD) 

8 pemor("waitpid error"): 

9 sleep(2): 

10 Tetum; 

JI 

也 

13 ”intmain0 

14 { intin: 

15 char buf[ MAXBUF]: 

16 pid tpid: 

17 

18 signal(SIGCHLD, handler2); 让 sigaction 错误 处 理 包 装 函数 */ 
19 

20 forGi=0:i<3:itH{ 

21 pid=fork0: 

22 让 id 一 0){ 

23 printft"Hello fiom child %d\n", (int)getpidO): 
24 sleep(1): 

25 exit(0); 

26 } 

27 

28 

29 店 父 进程 等 待 来 自 标准 输入 的 信息 并 进行 处 理 */ 
30 if((n=read(STDIN_FILENO, buf, sizeof(buf))) <0) 
31 perror("read error"): 

32 

33 Printf("Parent processing input\n"); 

34 while(l) 全 

35 exit(0): 

36 


*5.4.7 ”信号 处 理 引 起 的 竞争 

一 般 所 说 的 进程 间 同 步 是 指 分 属 不 同 进程 的 操作 在 发 生 时 间 上 必须 满足 的 某 种 约束 关系 ， 这 部 
分 内 容 将 在 第 6 和 第 7 章 中 进行 讲述 。 还 有 一 种 同步 是 进程 流 与 信号 处 理 程序 间 的 同步 ， 这 类 同步 
问题 比较 少见 ， 我 们 称 之 为 非常 规 同步 。sigrace.c 是 一 个 需要 在 进程 流 与 信号 处 理 间 同 步 的 示例 。 
在 该 例 中 ， 父 进程 用 一 个 工作 进程 池 记录 其 所 有 子 进程 ( 即 工作 进程 )， 每 个 工作 子 进程 一 个 条 目 ， 
用 于 父 进程 随时 了 解 工作 进程 的 情况 。addworker 和 mworker 函数 分 别 用 于 向 工作 进程 池 添 加 和 从 
中 删除 工作 进程。 


话 sigrace.c 源 代码 。 

这 是 一 个 存在 信号 处 理 竞争 的 程序 示例 : 如 果子 进程 在 父 进程 能 够 开始 运行 前 就 结束 , 那么 addworker 和 rmworker 函数 
就 会 以 错误 的 顺序 被 调用 ， 导 致 错误 。 

编译 命令 为 gcc -o sigrace.c sigrace.c */ 


1 voidhandler(intsig) 
| 
3 pid tpid: 
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4 while ((pid==waitpid(-1. NULL. 0))>0) ”请 回收 僵尸 子 进程 */ 
5 rmworker (pid): 上 # 删除 工作 进程 */ 

6 if(ermo 二 ECHILD) 

jr) pemor("waitpid error"): 

8 

9 

10 intmain(int argc. char **argv) 

1 4 

12 int pid, i; 

13 

14 signal(SIGCHLD, handler): 

15 initworkersO; 刻 初始 化 工作 进程 池 */ 
16 

17 for(i=0;i<100;i+) { 

18 if(pid=fork0) 一 0) 户 子 进程 */ 

19 execve("/bin/pwd", arev, NULL): 

20 

21 庆 父 进程 所 

22 addworker(pid): 店 将 子 进程 添加 到 工作 进程 列表 */ 
23 } 

24 exit(0); 

2 


这 个 程序 要 求 父 进程 创建 一 个 新 的 子 进程 时 ， 要 将 其 添加 到 工作 进程 列表 中 。 父 进程 在 
SIGCHLD 处 理 程序 中 回收 一 个 终止 的 (僵尸 ) 子 进程 时 ， 就 从 工作 进程 列表 中 删除 该 子 进程 。 表 面 上 
看 不 出 这 段 代码 有 什么 问题 。 然 而 ， 由 于 父 进程 main 函数 逻辑 流 、 子 进程 execve 逻辑 流 、 信 号 处 
理 函 数 handler 逻辑 流 之 间 是 并 发 关系 (参见 图 5-23)， 下 面 的 执行 顺序 是 可 能 的 : 

1) 父 进程 执行 fork 函数 ， 内 核 先 调度 新 创建 的 子 进程 而 非 父 进程 。 

2) 在 父 进程 能 够 再 次 运行 之 前 , 子 进程 已 经 终止 , 变 成 一 个 僵尸 进程 , 内 核 传 递 一 个 SIGCHLD 
信号 给 父 进程 。 

3) 之 后 ， 当 父 进程 再 次 获得 CPU 时 ， 内 核 看 到 待 处 理 的 SIGCHLD 信号 ， 父 进程 运行 处 理 程 
序 接收 这 个 信号 。 

4) 信号 处 理 程序 回收 终止 的 子 进程 ， 并 调用 mmworker 函数 ， 这 个 函数 什么 也 不 做 ， 因 为 父 进 
程 还 未 把 子 进程 添加 到 工作 进程 列表 中 。 

5) 信号 处 理 程序 运行 结束 后 ， 内 核 运 行 父 进程 ， 父 进程 从 fork 函数 返回 ， 通 过 调用 addworker 
函数 错误 地 把 不 存在 的 子 进程 添加 到 工作 进程 列表 中 。 


父 进 各 main 函数 逻辑 流 | 子 进程 cxecve 进 辑 流 | 信号 处 理 函 数 handler 罗 辑 流 
Is:pid=forkO | | 
| 19: execve("/bin/ls", argv, NULL) | 
| 十 
22:addwarker(pid) | {| |4 pid = waitpidCl, NULL 0) 
| | 
| 
| 


EY [5: mmworkder(pid) 


图 5-23 sigrace.c 中 ， 父 进程 main 函数 逻辑 流 、 子 进程 execve 逻辑 流 与 信号 处 理 函数 handler 逻辑 流 之 间 的 并 发 关系 : 
子 进程 结束 后 ， 才 会 向 父 进程 发 送 SIGCHLD 信号 ，handler 的 第 4 行 一 定 在 子 进程 的 第 19 行 完成 后 才 开 始 ; 
但 是 父 进程 main 函数 逻辑 流 的 第 22 行 与 子 进程 的 第 19 行 是 并 发 关系 , 与 handler 逻辑 流 也 是 并 发 关系 , 因此 ， 
父 进程 的 第 22 行 在 handler 的 第 5 行 后 执行 是 可 能 的 ， 它 们 间 存 在 竞争 
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因 


此 ， 父 进程 的 main 函数 流 和 信号 处 理 流 的 某 些 交 错 模式 ， 可 能 会 在 调用 addworker 之 前 调用 


Imworker。 这 会 导致 工作 进程 列表 中 出 现 一 个 不 正确 的 条 目 ， 对 应 于 一 个 不 再 存在 而 且 永 远 也 不 会 


被 删除 的 了 


C 作 进程 。 这 种 不 同 操作 间 存 在 以 错误 顺序 执行 的 情况 称 为 竞争 (race)。 在 这 里 ，main 函 


数 中 的 addworker 调用 和 处 理 程序 中 的 mworker 调用 之 间 存 在 竞争 。 如 果 addworker 赢得 先 机 ， 结 


果 就 是 正确 的 ， 否 则 结果 就 是 错误 的 。 这 种 错误 很 难 调试 和 检测 ， 因 


为 两 个 逻辑 流 间 的 并 发 执行 模 


式 太 多 。 有 时 运行 数 亿 次 ， 才 出 现 一 次 竞争 错误 。 但 竞争 必须 消除 ， 保 证 所 有 交错 执行 模式 都 能 得 
到 正确 的 执行 结果 。 
sigmask.c 给 出 了 消除 图 5-23 中 竞争 的 一 种 方法 。 通 过 在 fork 调用 之 前 阻塞 SIGCHLD 信号 ， 


在 addworker 调用 后 取消 信号 阻塞 ， 可 保证 信号 处 理 的 mmworker 调用 在 进程 流 的 addworker 调用 


元 


成 后 开始 执行 。 由 于 子 进程 继承 父 进 程 的 被 阻塞 信号 的 集合 ， 子 进程 必须 在 调用 execve 之 前 ,解除 
对 SIGCHLD 信号 的 阻塞 。 
让 sigmask.c 源 代码 


1 
2 
< 
4 
5 
6 
7 
8 
9 


10 
11 


父 进程 保证 在 相应 的 mmworker 调用 之 前 执行 addworker， 编 译 命令 为 gcc -0 sigmask sigmask.c -L. -lwrapper */ 


void handler(int sig) 
{ 
pid tpid; 


while (pid= waitpid(-1, NULL, 0)) > 0) 颇 回收 僵尸 子 进程 */ 
rmworker(pid); 语 从 工作 进程 列表 中 删除 子 进程 */ 


让 (emmo (=ECHILD) 
Perror("waitpid error"); 
bi 


int main(int argc, char **argv) 
{ 
int pid; sigset tmask: 


Signal(SIGCHLD, handler); 
initworkersO: 


while () { 
sigemptyset(&mask); 
sigaddset(&:mask, SIGCHLD); 
sigprocmask(SIG BLOCK. &mask, NULL); 


语 子 进程 */ 
ff((pid=fork0)=0) { 
sigprocmask(SIG UNBLOCK, &mask, NULD); 
Execve("/bin/ls". argv. NULL): 
} 


启 父 进程 所 
addworker(pid): 
sigprocmask(SIG UNBLOCK, &mask, NULL); 


雍 初始 化 工作 进程 列表 */ 


让 阻塞 SIGCHLD 信号 所 


庆 解除 信号 阻塞 */ 


片 将 子 进程 添加 到 工作 进程 列表 中 */ 
上 解除 阻塞 */ 
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了 exit(0): 

a 

程序 sigmask.c 用 到 了 信号 阻塞 、 解 除 阻塞 与 相关 函数 ， 说 明 如 下 : 
#include <signal h> 

int sigprocmask(int how, const sigset t *set, sigset t*oldseD): 

int sigemptyset(sigset_t *set): 


int sigfillset(sigset_t *set); 
int sigaddset(sigset tyset int signun): 
二 
返回 值 ， 如 果 成 功 ， 则 为 0， 否则 为 -1。 

int sigismember(const sigset_t *set, int signum); 
LL 返回 值 若 signum 是 sef 的 成 员 则 为 1 如 果 不 是 则 为 0， 若 出 错 , 则 为 -1。 | 

sigprocmask 函数 改变 表示 当前 已 阻塞 信号 的 集合 的 blocked 位 向 量 , 具体 的 行为 依赖 于 how 
的 值 。 

e@ SIG BLOCK: 添加 set 中 的 信号 到 blocked 中 (blocked= blocked | seb。 

e SIG_ UNBLOCK: 从 blocked 中 删除 set 中 的 信号 (blocked= blocked &~set)。 

® SIG SETMASK: blocked = set。 

如 果 oldset 非 空 ，blocked 位 向 量 以 前 的 值 会 保存 在 oldset 中 。 

sigemptyset、sigfillset、sigaddset 用 于 操作 set 信号 集合 : 

esigemptyset 初始 化 set 为 空 集 。 

e sigfillset 函数 将 所 有 信号 添加 到 set 中 。 

@ sigaddset 函数 添加 signum 到 set 中 ，sigdelset 从 set 中 删除 signum， 如 果 signum 是 set 的 成 

员 ， 那 么 sigismember 返回 1， 否 则 返回 0。 


医 到 守护 进程 


在 Linux 或 UNIX 操作 系统 中 ， 当 引导 系统 的 时 候 ， 会 开启 很 多 服务 为 用 户 提供 某 种 功能 ， 这 
些 服务 就 叫 作 守护 进程 或 Daemon 进程 ， 例 如 FTP 服务 、 计 划 任务 进程 crond、HTTP 进程 httpd， 
这 里 结尾 的 字母 d 就 是 Daemon 的 意思 。 守 护 进程 是 脱离 于 终端 并 且 在 后 台 运行 的 进程 。 一 般 用 户 
都 是 打开 终端 ， 在 终端 的 Shell 提示 符 下 输入 命令 以 执行 ， 此 时 命令 的 进程 受 该 终端 控制 ， 当 控制 
终端 被 关闭 时 ， 通 过 在 控制 终端 输入 命令 启动 的 进程 也 一 起 结束 。 而 守护 进程 则 不 受 终端 控制 ， 即 
使 终端 退出 ， 也 仍然 在 后 台 运行 。 守 护 进 程 脱离 终端 ， 是 为 了 避免 进程 在 执行 过 程 中 产生 的 信息 在 
任何 终端 上 显示 。 另 外 ， 守 护 进 程 也 不 会 被 任何 终端 产生 的 信息 所 打 断 。 很 多 情况 下 ， 用 户 需要 将 
自己 的 程序 作为 守护 进程 ， 例 如 网 络 应 用 程序 的 服务 器 端 。 因 此 ， 下 面 介绍 程序 开发 人 员 如 何 通过 
系统 调用 实现 守护 进程 。 创 建 守护 进程 的 编程 步骤 如 下 。 


1. 调用 fork 创建 新 的 进程 
这 会 是 将 来 的 守护 进程 ， 让 守护 进程 在 后 台 继续 执行 ; 
ipid-forkO) exit(0): 
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2. 脱离 控制 终端 、 登 录 会 话 和 进程 组 

进程 属于 一 个 进程 组 ， 进 程 组 号 PGID) 就 是 进程 组 长 的 进程 号 PID)。 登 录 会 话 可 以 包含 多 个 进 
程 组 。 这 些 进程 组 共享 一 个 控制 终端 ， 这 个 控制 终端 通常 是 创建 进程 的 登录 终端 。 控 制 终端 、 登 录 
会 话 和 进程 组 通常 是 从 父 进 程 继 承 而 来 的 。 守 护 进 程 要 摆脱 它们 ， 使 之 不 受 它们 的 影响 ， 方 法 是 调 
用 setsid 使 自己 成 为 会 话 组 长 。 

3. 关闭 打开 的 文件 描述 符 

进程 从 创建 它 的 父 进程 那里 继承 了 打开 的 文件 描述 符 。 若 不 关闭 ， 将 会 浪费 系统 资源 ， 造 成 进 
程 所 在 的 文件 系统 无 法 卸 下 以 及 引起 无 法 预料 的 错误 。 可 按 如 下 方法 关闭 它们 : 


for(i=0:;i<NR OPEN:i++) close (0 


4. 改变 当前 工作 目录 


守护 进程 不 属于 某 个 特定 用 户 ， 一 般 需 要 将 工作 目录 改变 到 根 目录 ， 使 普通 管理 员 因 需 要 钊 载 
原来 的 工作 目录 : 
chdir ("/"); 


5. 处 理 文件 描述 符 0、1、2 


打开 文件 描述 符 0、1、2( 分 别 对 应 标准 输入 、 标 准 输出 、 标 准 错误 输出 )， 并 把 它们 重 定向 到 
/dev/null。 

daemon.c 是 一 个 守护 进程 示例 ， 它 每 隔 10 秒 将 运行 状态 写 入 日 志文 件 testlog。 
上 # 守护 程序 示例 daemon.c 的 源 代码 */ 


#include "wrapper.h" 


1 

2 

3 intinit daemon(void) 
人 

5 pid tpid: inti: 
6 

7 

8 


Pid = fork (): 上 # 创建 新 进程 */ 
让 id 一 -0D) retum -1: 
else if (pid !=0) 

10 exit (EXIT_SUCCESS): 


12 if(setsid () 一 -1) retum -1: 此 创建 新 会 话 和 进程 组 */ 
13 站 (chdir (") 二 -1) retum-l: 。 /# 将 工作 目录 设置 为 根 目录 */ 


14 

15 for(i=0:i<NR_OPEN:it+) ” 族 关闭 所 有 打开 的 文件 */ 
16 close GD: 

17 雍 重 定向 文件 描述 符 0、1、2 到 /dev/inull */ 

18 open ("/dev/null".O RDWR): ~ /*stdin*/ 

19 dup (0): 让 stdout */ 

20 dup (0): "stderror */ 
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21 Tetum 0: 


24 int main(void) 


26 FILE *fp: 
27 time t t 
pd init_daemon(); 诊 初始 化 为 Daemon */ 


30 while(1) 庆 每 隔 一 分 钟 向 testlog 报告 运行 状态 所 
31 二 

32 sleep(10): 

33 iR\(fp=fopen("/home/can/test.log","a")) >=0) 

34 { 

35 t=time(0); 

36 fprintf(fhp,"Im here at %s/n",asctime(localtime(&0)) ): 
3 fclose(fp); 

38 } 

39 } 

40 } 

编译 和 运行 程序 : 

Sgcc -0 daemon daemon.c 

$ /daemon 

Stail testlog 


Im here at Sun Mar 20 06:06:30 2016 
/nlIm here at Sun Mar 20 06:06:40 2016 


许多 UNIX 系统 提供 了 C 库 函 数 daemon 来 自动 完成 守护 程序 的 初始 化 工作 ， 从 而 简化 一 下 繁 


杂 的 工作 : 


#include <unistd h> 
int daemon(int nochdir, int noclose): 


若 参 数 nochdir 为 非 0 值 ， 就 不 会 将 工作 目录 更 改 为 根 目录 ; 如 果 参 数 noclose 为 非 0 值 ， 就 不 
会 关闭 所 有 打开 的 文件 描述 符 , 通常 将 这 些 参数 设置 为 0。 函 数 执行 成 功 时 返回 0， 失 败 时 返回 - 1， 


并 将 ermo 设置 为 错误 码 。 


进程 、 内 核 与 系统 调用 间 的 关系 


工作 中 的 计算 机 系统 可 看 成 包含 两 种 运行 实体 , 若干 用 户 进程 与 系统 进程 ,以 及 操作 系统 内 核 。 
用 户 进程 是 使 用 者 启动 的 各 种 进程 ， 如 浏览 器 、 字 处 理 器 、 聊 天 软件 等 ， 系 统 进程 是 为 用 


户 进程 的 


运行 提供 环境 的 各 种 系统 服务 ， 如 用 户 登录 进程 、IP 安全 策略 管理 进程 、 文 件 打 印 服务 进程 、 资 源 
管理 器 等 。 操 作 系统 内 核 是 对 进程 进行 管理 控制 、 对 系统 资源 进行 管理 维护 的 实体 ， 为 所 有 进程 的 


运行 提供 运行 环境 。 


图 5-24 是 Linux 进程 、Linux 内 核 与 系统 调用 间 的 关系 图 , 三 者 之 间 的 关系 表现 在 以 下 几 个 方面 : 
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用 户 进程 和 


系统 调用 
函数 


内 核 函 数 


操作 系统 
内 核 


图 5-24 Linux 进程 、Linux 内 核 与 系统 调用 间 关 系 图 


(1) 为 了 让 整个 系统 有 条 不 率 地 工作 , Linux 仅 允 许 系 统 内 核 具 有 对 整个 系统 软 硬 件 资源 进行 操 
作 管理 的 特权 ， 负 责 进 程 管理 、 文 件 管理 、 设 备 管理 、 内 存 管理 ， 拥 有 整个 系统 的 进程 队列 、 系 统 
打开 文件 表 和 内 存 分 配 表 。 

(2) 系统 对 进程 的 操作 权限 进行 了 严格 限制 , 不 允许 进程 直接 读 写 文件 、 访 问 VO 设 备 、 改变 CPU 
模式 , 甚至 不 允许 进程 间 直 接 交 互 , 进程 运行 过 程 中 需要 使 用 系统 资源 、 执行 输入 /输出 等 特权 操作 ， 
必须 委托 Linux 内 核 代为 执行 。 

(3) 进程 执行 过 程 中 通过 调用 系统 调用 函数 来 请 求 内 核 为 其 服务 ， 如 调用 函数 write 写 文件 ， 调 
用 fork 函数 创建 进程 ， 调 用 wait 清理 僵尸 进程 ， 而 这 些 函数 的 功能 实际 由 sys_write、sys_fork 等 内 
核 函 数 完成 ， 因 为 只 有 内 核 中 的 函数 才 有 执行 IO 操作 、 创 建 进程 、 加 载 程序 等 特权 。 应 用 程序 要 
执行 进程 操作 、 文 件 操作 、 进 程 间 通信 、 网 络 通信 ， 都 必须 通过 系统 调用 函数 委托 内 核 来 完成 。 


本 章 小 结 


进程 是 计算 机 专业 学 生 必须 掌握 但 又 容易 混淆 的 操作 系统 的 基本 概念 ， 是 计算 机 系统 原理 中 最 
基本 的 概念 ， 但 以 往 很 多 学 生 对 进程 概念 的 理解 仍 不 够 好 。 

本 章 从 读者 看 得 见 、 摸 得 着 的 进程 列表 入 手 ， 引 出 进程 的 基本 特点 。 在 此 基础 上 介绍 进程 创建 
函数 fork、 进 程 创 建 过 程 ， 讨 论 进 程 特征 。 进 程 最 重要 的 特征 就 是 每 个 进程 都 有 独立 的 地 址 空间 ， 
执行 过 程 中 互 不 影响 。 进 程 的 另 一 个 重要 特征 是 并 发 ， 两 个 并 发 进程 往 前 推进 ， 交 错 执行 。 

用 fork 函数 创建 的 子 进程 拥有 与 父 进程 相同 的 程序 代码 , 要 让 其 执行 不 同 的 程序 ,需要 调用 exec 
函数 族 。 在 Linux 系统 中 ，fork 与 exec 函数 相配 合 ， 不 断 繁衍 ， 创 造 出 丰富 多 彩 的 进程 世界 。 

不 管用 何 种 方式 结束 进程 ， 进 程 都 进入 终止 状态 ,虽然 大 部 分 资源 已 归还 系统 , 但 其 PCB 仍 留 
在 系统 中 ,成 为 僵尸 进程 ,等 待 系统 内 核 或 父 进程 从 中 读 取 有 用 数据 。 父 进程 调用 waitpid 函数 对 处 


和 2o4 
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于 终止 状态 的 子 进程 进行 最 后 的 清理 。 

进程 执行 过 程 中 ， 经常 需 要 处 理 一 些 突 发 事件 ， 如 用 户 按键 、 电 源 故 障 、 被 零 除 、 内 存 越界 等 ， 
这 些 突 发 事件 虽然 作为 系统 中 断 先行 处 理 ， 但 最 终 要 作为 信号 通知 相关 进程 做 进一步 处 理 ， 进 程 通 
过 信号 机 制 来 处 理 这 些 突 发 事件 。 Linux 进程 要 对 信号 进行 处 理 , 只 需要 用 signal 函数 为 相关 信号 绑 
定 一 个 信号 处 理 函数 。 

Linux 进程 有 两 类 : 一 类 是 交互 式 进程 ， 由 用 户 启动 ， 执 行 完 赋予 的 任务 后 终止 ， 另 一 类 是 守 
护 进 程 ， 它 们 向 外 提供 各 种 服务 ， 要 求 一 直 处 于 运行 状态 ， 即 使 用 户 注销 或 父 进程 终止 ， 守 护 进 程 
也 仍 继续 运行 。 


课 后 作业 


多 思考 与 练习 题 5.26 ”进程 控制 块 (PCB) 中 应 该 包括 哪些 内 容 ， 说 明 进程 有 哪些 属性 是 必 不 可 少 的 。 
8 思考 与 练习 题 5.27 进程 有 哪 三 种 基本 状态 ?处 于 各 状态 的 进程 有 何 特征 ? 
寻思 考 与 练习 题 5.28 给 出 导致 进程 状态 转换 的 事件 : 

(1) 运行 3 就 绪 ，] 种 ; 

(2) 创建 3 就 绪 ，1 种 ; 

(3) 运行 > 阻塞，3 种 ; 

(4) 阻塞 3 就绪，3 种 ; 

(5) 运行 3 终止 ，4 种 。 
和 思考 与 练习 题 5.29 ”结合 进程 结构 和 进程 队列 管理 ， 说 明 fork、exit、wait 等 系统 调用 内 核 函 
数 的 执行 会 导致 进程 控制 块 、 进 程 状态 、 进 程 队列 发 生 何 种 变化 ? 
条 ”思考 与 练习 题 5.30 ” 画 出 下 列 程序 的 并 发 关系 图 ， 分 析 下 列 程序 有 几 种 可 能 的 输出 序列 ? 


intmain0 


让 (fork0 一 0){ 
printf ("A"): 
Printf ("B"): 
exit(0): 

} 

else { 
if (fork0—0) { 

Printf("C") ; 

Printf"D") ; 


exit(0): 


”思考 与 练习 题 5.31 编写 一 个 程序 ， 创 建 子 进程 ， 在 子 进程 中 执行 “ps -A” 命 令 ， 父 进程 
等 待 子 进程 结束 后 打印 “child over” 及 处 理 的 子 进程 号 。 
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如 思考 与 练习 题 5.32 编写 一 个 程序 ， 创 建 如 图 5-25 所 示 的 进程 族 亲 结构 ， 其 中 pl 是 程序 启动 
时 由 加 载 程序 创建 的 第 一 个 进程 。 各 进程 的 输出 信息 分 别 如 下 : 


1 


pa ] | pzz | 


5-25 ”进程 族 亲 结构 


pl: Tam fatherprocess 

p11: Iam elder brother process 

p12: I am young brother process 
p121: Iam eldergrandson process 
p122: I am younger grandson process 


gf 思考 与 练习 题 5.33 ” 画 出 下 列 程序 的 进程 族 亲 关系 图 ， 给 出 程序 输出 多 少 个 hello 行 。 


#include <unistd h> 
intmain0 
{ 
inti; 
fork0: 
i=forkO:; 
if(i>0) fork0: 
if(i>0) fork0: 
printf"hellom 
} 


有 ”思考 与 练习 题 *5.34 分析 下列 得 态 茶 协 多 少 个 jeljo 看 


#include "wrapper.h" 
void callit 0 
fork0: 
Printf("hellon"); 
这 forkO>0) 
exit(0); 
else 
Printf("hellon"): 
Tetum; 
} 
int main0 
{ 
callit |; 
printf("hellon"): 
exit(0); 
多 思考 与 练习 题 5.35 分 析 下 列 程序 有 哪 几 种 可 能 的 输出 。 


#include "wrapper.h" 
intmain0 
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int x=3; 
这 (ork0 (=0) 
Pprintf("x=%d\n", +HX) 
printf("x=9dn", —x); 
exit(0); 
} 
守 思考 与 练习 题 5.36 下 面 的 程序 有 多 少 个 hello 输出 行 ? 


#include "wrapper.h" 
void callit 0 
下 
pid t pid: 
Pid=forkO: 
这 pid 一 0) 
printf("hellon"): 
Tetum NULL:; 


callitO; 
printf("hellon") ; 
exit(0); 
} 
于 思考 与 练习 题 5.37 下 面 的 函数 打印 多 少 行 输出 ?用 一 个 关于 nn 的 函数 表示 。 假设 n>1。 
void callit(int n) 
{ 
inti; 
for(i=0;i<n:;it+) 
forkO: 
printf (hello \n") ; 
exit(0); 
} 
品 思考 与 练习 题 5.38 ”下列 程序 可 能 的 输出 序列 有 哪些 ? 


int main() 


让 (fork0 一 0){ 
Printf("a"): 
printfew"): 
} 
else 
让 dork0 一 0) 
printtb) : 
else 
pmintfe'c ) 
} 
彩 ” 思考 与 练习 题 5.39 阅读 下 面 的 两 进程 并 发 程序 ， 计 算 该 程序 有 多 少 种 可 能 的 输出 顺序 。 


intmain0 
{ 
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让 (ork0 一 0){ 


printf'Anm ) 
exit(0); 

1 

else { 
Printf("“Bl\n"); 
Printf("B2n"); 
Printf(“Bm\n") 
exit(0); 


} 
更 ”思考 与 练习 题 5.40 ”假设 三 个 并 发 进程 P1、P2、P3 分 别 有 操 作 序列 S1、S2、...、Sn 和 T1、 
T2、...、Tm 以 及 Ul、U2、...、Uk， 这 些 操作 有 多 少 种 不 同 的 并 发 执行 顺序 ? 
多 + 思考 与 练习 题 541 阅读 下 面 的 程序 ， 写 出 程序 的 运行 结果 。 父 进程 的 源 程序 为 : 
int main0 
int i, pid, status; 
pid=forkO: 
这 pid 一 0) 
execlp("subp", "subp", "2", NULL): 
waitpid(pid,NULL.0); 
Printf("hello father process\n"): 
exit(0):; 
} 
子 进程 的 源 程序 subp.c 为 : 


#include"wrapper.h" 
int main(int argc, char *argv[]) 
{inti: 
for(1; i<=4; HH) { 
printf("%c\n", *argv[1]): 
(targv[1D++: 


} 
史 ” * 思 考 与 练习 题 5.42 下 列 程序 的 语义 是 : 程序 启动 后 ,用 户 按 下 CtrltC 键 , 程序 捕获 SIGINT 
信号 ， 向 子 进 程 发 送信 号 SIGNUSR1， 子 进程 收 到 信号 后 输出 “killed by pa process” 并 终止 。 


pid t pid: 
void pa(int sig) { 
kill(pid.SIGUSR1): 
} 
void child(int sig) { 
iflsig—SIGUSR]1) { 
Printf("killed by pa process): 
exit(0): 
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intmain0 { 
pid=forkO: 
if(pid—0) { 
usleep(1): 
signal(SIGUSR 1 .child): 
pause(); 
exit(0); 
} 
else { 
signal(SIGINT.pa); 
Pause(); 
exit(0): 
} 
} 


实际 运行 时 ， 并 未 看 到 输出 。 请 通过 分 析 进 程 间 的 并 发 关系 ， 找 出 原因 ， 并 给 出 正确 代码 。 
和 * 思 考 与 练习 题 5.43 ”考虑 下 面 的 程序 : 
void end(void) {printf("2"): } 
int main|) 
{ 
让 (fork0 一 0) 
atexit(end):; 
if(fork0 =0) 
Printf("0");: 
else 
printf("1");: 
exit(0); 
} 
判断 下 面 哪个 是 可 能 输出 的 。 提示: atexit 函数 以 一 个 指向 函数 的 指针 为 输入 ， 并 将 它 添加 到 一 
个 函数 列表 (初始 为 空 ) 中 。 当 exit 函数 被 调用 时 ， 会 调用 该 函数 列表 中 的 函数 。 
A.112002  B.211020 CC.102120  D.122001 E100212 
思考 与 练习 题 5.44 写 一 个 程序 ， 由 父 进 程 创建 两 个 子 进程 ,通过 在 终端 输入 “Ctrl \” 组 合 键 
向 父 进程 发 送 SIGQUIT 软 中 断 信号 或 由 系统 时 钟 产生 SIGALRM 软 中 断 信号 ， 发 送 给 父 进程 ; 父 进 
程 接收 到 这 两 个 软 中 断 的 其 中 一 个 后 ， 向 其 两 个 子 进程 分 别 发 送 整数 值 为 16 和 17 的 软 中 断 信号 ， 子 
进程 获得 对 应 的 软 中 断 信号 后 , 终止 运行 ; 父 进程 调用 wait 函数 等 待 两 个 子 进程 终止 ， 然后 自我 终止 。 
”思考 与 练习 题 545 阅读 下 面 的 程序 , 假设 数据 文件 data 的 内 容 为 “abcdefghijklmnopqrstuvwxyz”， 
请 给 出 三 个 程序 中 父子 进程 所 有 可 能 的 输出 。 


(1) 程序 A (2) 程序 B (3) 程序 C 

intmain0 intmain0 intmain0 

{int fd: 
int fd: int fd: char s[100]: 
char s[100]:; char s[100]: fd=open("data".O_RDONLY .0): 
fd=open("data".O_RDONLY.0) fork0: forkO): 

fd=open("data".O_ RDONLY.0): lseek(fd, 2, SEEK_CUR): 

forkO: read(fd.s.5): Tead(fd,s,5): 
Tead(fd,s,5): s[SF"0'; s[SF"\O': 
s[5F\0'; Printf("%s",s); Printf("%%s",s): 
Printf("%%s",s): } } 


} 
寻思 考 与 练习 题 5.46 阅读 下 面 的 程序 ， 分 析 各 个 进程 的 输出 是 什么 。 


int main() 
. 
int x=10; 
if(fork0 —0) 
XxX+20; 
else { 
XxX+30; 
让 (fork0 一 0) 
X=xX+40; 
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线程 控制 与 同步 互 斥 


Linux 系 统 中 的 进程 可 以 互相 协作 ， 互 相 发 送 消息 、 发 送信 号 ， 甚 至 可 以 共享 内 存 段 。 但 从 本 质 
上 说 ， 进 程 是 操作 系统 内 的 独立 实体 ， 要 想 在 它们 之 间 共 享 信息 ， 协 作 完成 某 项 任务 ， 并 不 容易 ， 
一 是 编程 麻烦 ， 二 是 效率 不 高 。 现 代 操 作 系统 都 支持 一 种 轻 量 级 的 进程 ， 称 为 线程 (hread)。 线 程 是 
进程 内 的 一 种 逻辑 流 , 线程 管理 和 调度 开销 很 低 , 线程 间 通 信 非 常 方 便 ,基于 线程 进行 多 任务 编程 ， 
方便 直观 ， 非 常 适合 需要 多 任务 协作 的 应 用 。 本 章 介绍 多 线程 并 发 控制 方法 ， 分 析 线 程 间 变量 共享 
和 竞争 带 来 的 问题 ， 讨 论 线程 同步 与 互 斥 的 原理 和 编程 技术 。 


本 章 学 习 目 标 : 

。 理解 线程 概念 和 并 发 特征 ， 分 辨 线程 与 进程 的 区 别 与 联系 

。 掌握 多 线程 应 用 编程 技术 ， 掌 握 线程 间 数据 传递 的 基本 方法 

e 掌握 共享 变量 识别 方法 ， 理 解 多 线程 访问 共享 变量 可 能 带 来 的 问题 

。 理解 临界 资源 、 临 界 区 、 线 程 互 斥 、 线 程 同步 的 基本 概念 ， 理 解 保证 临界 区 互 斥 执行 的 基 

本 思想 

掌握 用 信号 量 和 P/V 操作 来 解决 互 斥 、 同 步 问题 的 编程 方法 

e 掌握 生产 者 /消费 者 、 读 者 / 写 者 问题 这 两 个 经 典 同步 问题 的 编程 方法 ， 并 用 以 分 析 和 解决 实 
际 应 用 问题 

ee 了 解 AND 型 信号 量 、 信 号 量 集 、 条 件 变 量 和 管 程 等 同步 机 制 

。 理解 线程 安全 、 可 重 入 性 、 线 程 竞争 的 基本 概念 

。 掌握 多 线程 并 发 编程 及 性 能 分 析 


[可 线程 概念 


6.1.1 什么 是 线程 


启动 一 个 传统 的 C 语言 程序 后 ， 会 产生 一 个 进程 ， 进 程 从 main 函数 开始 ， 沿 着 程序 流程 往 下 
执行 。 不 严格 地 说 ， 可 认为 每 次 仅 执行 一 条 语句 (或 一 条 指令 )， 前 一 条 语句 (或 指令 ) 完 成 ， 后 一 条 语 


句 ( 或 指令 ) 才 能 开始 ， 这 种 执行 方式 称 为 串 行 执行 。 这 种 程序 结构 存在 两 个 问题 : 

(1) 一 个 进程 只 有 一 个 代码 执行 序列 (或 控制 流 )， 只 允许 一 个 CPU( 或 CPU 核 ) 为 其 服务 。 即 使 
在 具有 多 CPU 或 多 核 的 系统 中 ， 也 只 能 分 派 一 个 CPU 或 核 给 进程 使 用 ， 其 他 CPU 或 核 即 使 空闲 ， 
也 难以 帮忙 加 快 进程 的 执行 过 程 ， 不 便 发 挥 多 CPU 或 多 核 系统 强大 的 计算 能 力 。 

(2) 进程 每 段 时 间 只 能 执行 一 项 活动 ， 若 有 多 项 需要 并 发 执行 的 活动 ， 传 统 程序 结构 很 难 进行 
有 效 协 调 。 比 如 程序 在 等 待 用 户 输入 的 同时 ， 还 要 从 消息 队列 接收 消息 ， 而 此 时 用 户 输入 尚未 完成 ， 
消息 还 未 到 来 。 

采用 多 线程 技术 能 很 好 地 解决 上 述 问题 。 线 程 被 定义 为 进程 内 的 一 个 执行 单元 或 可 调度 实体 ， 
每 个 执行 单元 可 执行 进程 的 一 段 程序 代码 (如 函数 )。 在 一 个 进程 内 可 创建 多 个 线程 ， 这 些 线程 都 是 
并 发 逻辑 流 ， 每 个 线程 可 执行 一 项 独立 的 活动 或 功能 。 例 如 Web 服务 器 ， 一 个 线程 在 给 某 个 浏览 器 
产生 网 页 时 ， 另 一 线程 就 可 侦 听 其 他 浏览 器 发 来 的 请 求 。 

属于 同一 进程 的 多 个 线程 位 于 同一 个 地 址 空间 内 ， 共 享 进程 拥有 的 资源 ， 包 括 代码 、 数 据 (全 
变量 )、 堆 和 打开 文件 等 。 线 程 需要 堆栈 、 程 序 计数 器 等 少量 资源 ， 线 程 又 称 轻 量 级 进程 (LWP， 
Light-Weight Process)， 如 图 6-1 所 示 。 


可 


进程 
用 户 地 址 空间 | 


线程 一 线程 二 线程 三 


图 6-1 线程 与 进程 的 关系 


在 多 线程 应 用 环境 下 ,进程 是 资源 分 配 的 最 小 单位 ,而 线程 是 CPU 调度 的 最 小 单元 。 一 个 进程 
内 的 多 个 线程 不 但 共用 进程 的 地 址 空间 ， 还 共享 进程 的 打开 文件 、 外 部 设备 等 资源 。 

同 进程 管理 相似 ， 线 程 也 将 与 之 相关 的 属性 放 在 线程 控制 块 (TCB) 内 ， 每 个 线程 拥有 一 个 TCB 
和 一 个 线程 堆栈 。TCB 包括 线程 ID(Thread TID)、 线 程 状态 、 栈 指针 、 通 用 寄存 器 、 程 序 计数 器 和 
标志 寄存 器 ， 因 线程 工作 所 需 的 大 部 分 资源 在 进程 中 ,线程 需要 维护 的 资源 、 属 性 很 少 ,线程 创建 、 
销毁 所 需 开销 很 低 。 

在 多 线程 应 用 程序 中 ，CPU 分 配给 线程 ， 使 进程 不 断 往 前 推进 。 由 于 CPU 数量 一 般 较 少 ， 加 
上 线程 运行 过 程 中 也 存在 等 待 某 种 事件 发 生 的 问题 ， 每 个 线程 在 其 生命 周期 内 ， 也 有 就 绪 、 运 行 、 
阻塞 等 基本 状态 ， 各 状态 之 间 也 有 类 似 于 图 5-3 的 状态 转换 关系 。 

多 进程 与 多 线程 的 区 别 : 可 将 多 进程 比喻 成 把 一 个 大 家 庭 分 成 很 多 有 独立 房屋 的 小 家 庭 ， 而 将 
多 线程 比喻 成 生活 在 同一 屋檐 下 的 家 庭 成 员 。 


6.1.2 ”线程 执行 模型 


多 线程 的 执行 模型 在 某 些 方面 和 多 进程 的 执行 模型 是 相似 的 。 每 个 进程 开始 生命 周期 时 都 是 单 
一 线程 ， 这 个 线程 称 为 主线 程 (main thread)。 在 某 一 时 刻 ， 主 线程 创建 一 个 对 等 线程 (peer thread)， 从 
这 个 时 间 点 开始 ， 两 个 线程 就 并 发 地 运行 。 在 此 过 程 中 ， 若 主线 程 因 执行 慢 速 系统 调用 ， 例 如 read 
或 sleep 调用 ， 或 被 系统 的 间隔 计时 器 中 断 ， 而 暂时 不 能 往 下 推进 ， 控 制 就 会 通过 上 下 文 切 换 传递 
到 对 等 线程 。 对 等 线程 运行 一 段 时 间 ， 控 制 又 传 回 主线 程 ， 如 此 反复 ， 如 图 6-2 所 示 。 
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图 6-2 线程 执行 模型 


虽然 多 线程 与 多 进程 有 相似 的 并 发 特征 ， 但 二 者 之 间 至 少 有 三 个 重要 差别 。 一 是 线程 的 上 下 文 
要 比 进程 的 上 下 文 小 得 多 ， 上 下 文 切换 快 。 二 是 线程 不 按 族 亲 结构 组 织 。 和 一 个 进程 相关 的 线程 组 
成 对 等 线程 池 (pool), 彼此 独立 对 等 。 主 线程 和 其 他 线程 的 区 别 仅 在 于 主线 程 总 是 进程 中 第 一 个 运行 
的 线程 。 由 于 线程 间 对 等 , 一 个 线程 可 以 终止 任何 其 他 对 等 线程 , 或 者 等 待 任何 其 他 对 等 线程 终止 。 
三 是 对 等 线程 位 于 一 个 进程 内 ， 共 享 数据 非常 方便 。 


6.1.3 ”多 线程 应 用 


除了 创建 新 线程 比 创建 新 进程 的 开销 小 很 多 之 外 ， 多 线程 方法 还 有 很 多 其 他 特性 ， 使 得 它 非常 
适合 于 一 些 应 用 场景 。 

可 使 一 个 进程 并 发 执行 多 项 活动 ， 比 如 在 需要 同时 等 待 用 户 输入 和 等 待 网 络 消息 的 应 用 中 ， 可 
为 每 个 等 待 活动 创建 专用 线程 ， 解 决 传统 串 行 编程 难以 处 理 的 问题 。 

将 一 个 耗 时 的 进程 任务 划分 成 很 多 小 任务 , 同时 在 多 个 CPU 或 核 上 执行 , 大 幅 提 高 程序 执行 效 
率 。 比 如 在 矩阵 乘法 问题 4(mx 局 xB(kxn) =Clmxn) 中 ， 就 可 以 将 矩阵 C 中 的 元 素 划分 为 多 行 ， 每 一 
行 安排 一 个 线程 来 计算 。 若 多 个 线程 都 能 同时 获得 处 理 器 并 行 执行 ， 则 整个 矩阵 乘法 运算 的 运算 时 
间 可 成 倍 降低 。 


6.1.4 ”第 一 个 线程 


Posix 线程 (Pthreads) 是 C 程序 中 处 理 线程 的 标准 接口 。 它 最 早出 现在 1995 年 ， 而 且 在 大 多 数 
UNIX 系统 上 都 可 用 。Pthreads 定义 了 大 约 60 个 函数 ， 函 数 名 大 多 以 pthread 开头， 提供 线程 创建 、 
取消 、 通 信 、 同 步 等 功能 。 

pthreadl.c 是 一 个 简单 的 Pthreads 多 线程 程序 。 主 线程 调用 函数 pthread_create 来 创建 一 个 对 等 
线程 ， 之 后 两 个 线程 并 发 执行 ， 输 出 若干 行文 本 。 对 等 线程 执行 完 任务 函数 peertask 后 终止 。 当 主 
线程 调用 pthread join 检测 对 等 线程 终止 后 ， 最 后 调用 exit 终止 进程 。 


让 第 一 个 多 线程 程序 pthreadl.c 的 源 代码 */ 


#include “wrapper.h" 
Void * peertask(void *vargp): 
intmain0 
{ pthread ttid; 
inti; 
pthread_create(&tid. NULL. peertask, NULL): 


Duwhewnb 
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这 forGF=0:i<2:itH{ 

8 Printf("main thread looped %d timesm 
9 usleep(10); 

10 } 

11 pthread join(tid, NULL): 

12 exit(0); 

到 而 水 


15 ”void *peertask(void *vargp) 


6 

17 forG=0:i<4:itH{ 

18 Pprintf("peer thread looped %d times\n" i): 
19 usleep(10): 

20 上 

21 TIetumNULL: 

7 


上 述 程序 中 调用 的 所 有 以 “pthread_” 开 头 的 库 函 数 的 代码 实现 都 在 库 文件 libpthread.so 或 
libpthread.a 中 ， 因 此 编译 命令 中 必须 添加 -lpthread 选项 ， 才 能 找到 这 些 函数 的 实现 代码 ， 与 目标 代 


码 文件 pthread1.0 链接 后 ， 产 生 可 执行 程序 : 
Sgce pthreadl.c -opthreadl -L. -iwrapper -lpthread 
最 后 执行 程序 : 
§ /prhreadl 
peer thread looped 0 times 
main thread looped 0 times 
peer thread looped 1 times 
main thread looped 1 times 
peer thread looped 2 times 
peer thread looped 3 times 


这 就 是 我 们 看 到 的 多 线程 程序 ， 下 面 进行 解析 : 


G main 函数 刚 被 调用 时 ， 整 个 进程 只 有 一 个 执行 序列 ， 我 们 称 之 为 主线 程 (tnain thread)。 主 线 
程 执行 pthread create 以 创建 一 个 新 的 对 等 线程 ， 对 等 线程 的 任务 函数 是 peertask。 

@) 接 下 来 ， 主 线程 和 对 等 线程 一 起 往 下 执行 ， 主 线程 执行 第 7~10 行 的 for 循环 ， 对 等 线程 执 
行 peertask 函数 中 第 17~20 行 的 for 循环 。 由 于 每 个 线程 输出 一 行文 本 后 就 调用 usleep 函数 睡眠 ， 


让 出 CPU， 因 此 控制 在 两 个 线程 间 来 回 切换 ， 导 致 它们 的 输出 交错 显示 。 


@ 主线 程 在 第 6 行 调 用 pthread_create， 将 创建 的 对 等 线程 标识 符 存放 在 变量 td 中 ， 对 等 线程 


的 任务 函数 用 第 3 个 参数 指定 ， 第 11 行 以 tid 为 参数 调用 pthread join 操作 对 等 线程 。 


@ 对 等 线程 执行 完 任务 函数 peertask 的 retum 语句 后 终止 ， 主 线程 调用 pthread join 函数 等 待 


对 等 线程 终止 ， 最 后 调用 exit(0) 终 止 整个 进程 。 
@ 主线 程 和 对 等 线程 并 发 执行 ， 其 输出 以 交错 方式 显示 。 


214 


第 6 章 线程 控制 与 同步 互 斥 


多 线程 并 发 特征 与 编程 方法 


6.2.1 Pthreads 线程 API 


Pthreads 提供 了 phtread_create、pthread_ exit、pthread join、pthread_detach、pthread_cancel 等 
API 函数 ， 用 于 创建 、 退 出 、 线 程 、 分 离 和 取消 线程 。 


1. 创建 线程 


线程 通过 调用 pthread_create 函数 来 创建 其 他 线程 。 


#include<pthread h> 
typedef void *(Func)(void *): 


int pthread_create(pthread_t *tid, pthread_attr_t *attr, Func func, void *arg); 
返回 值 ; 若 成 功 ， 则 返回 0; 若 失 败 ， 则 返回 非 零 值 。 


pthread_create 函数 创建 一 个 新 的 线程 ， 在 新 线程 的 上 下 文中 运行 线程 例 程 func。attr 参数 用 于 
改变 新 创建 线程 的 默认 属性 ， 一 般 设 置 为 NULL。 

新 线程 的 任务 是 执行 func 函数 调用 ，func 是 Func 类 型 的 函数 指针 ， 接 收 pthread_create 函数 传 
递 过 来 的 void* 类 型 指针 参数 arg， 返 回 一 个 void* 类 型 指针 。 

这 里 typedef void *(Func) (void *) 是 函数 指针 类 型 的 定义 语法 ， 它 与 按 早期 规范 的 定义 typedef 
void *(*Func) (void *) 是 等 价 的, 后 者 可 能 在 理解 上 更 加 自然 , 表示 用 Fune 定义 的 函数 指针 变量 func 
的 原型 是 void *func(void *)。 

当 pthread_create 函数 返回 时 ,参数 td 包含 新 创建 线程 的 ID。 新 线程 可 以 通过 调用 pthread self 
函数 来 获得 自己 的 线程 ID。 


#include<pthread.h> 


pthread tpthread selfvoid): 


2. 终止 线程 


线程 是 以 下 列 方 式 之 一 终止 的 : 

e ， 当 项 层 的 线程 例 程 (函数 ) 返 回 时 ， 线 程 会 隐 式 地 终止 。 

e@ 通过 调用 pthread_exit 函数 ， 线 程 会 显 式 地 终止 。 如 果 主 线程 调用 pthread_exit， 它 会 等 待 所 
有 其 他 对 等 线程 终止 ， 然 后 终止 主线 程 和 整个 进程 ， 返 回 值 为 thread retum。 

e 若 某 个 对 等 线程 调用 UNIX 的 exit 函数 ， 该 函数 会 终止 进程 ， 当 然 也 会 终止 所 有 与 该 进程 
相关 的 线程 。 

e 一 个 对 等 线程 可 以 某 个 对 等 线程 的 ID 作为 参数 调用 pthread_cancel 函数 来 终止 该 线程 。 

pthread_exit 和 pthread_cancel 函数 声明 如 下 : 

#nclnde<pthread h> 

void pthread exit(void *thread retum): 


返回 值 : 若 成 功 ， 则 返回 0; 若 失败 ， 返 回 非 零 值 。 
void pthread_cancel(pthread ttid): 


返回 值 ， 若 成 功 ， 则 返回 0; 若 失 败 ， 返 回 非 零 值 。 
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3. 回收 已 终止 线程 的 资源 
线程 通过 调用 pthread join 函数 等 待 其 他 线程 终止 。 
#include<pthread h> 


intpthread join(pthread ttid. void **thread return) ; 


返回 : 若 成 功 ， 则 返回 0， 车 失败 ， 返 回 非 零 值 。 
pthread join 函 数 会 被 阻塞， 直到 线程 td 终止 ， 将 线程 例 程 返回 的 (void*) 类 型 指针 赋值 到 
thread retum 指 向 的 单元 位 置 , 可 回收 已 终止 线程 占用 的 存储 器 资源 , 或 获得 已 终止 进程 的 终止 状态 。 
注意 , 与 UNIX 的 wait 函数 不 同 ,pthread join 函数 只 能 等 待 一 个 指定 的 线程 终止 。 如 果 要 等 待 
任何 一 个 线程 终止 ， 需 要 程序 员 自行 设计 检测 机 制 ， 并 配合 pthread join 函数 来 实现 ， 这 是 Pthreads 
规范 的 一 个 缺陷 。 


4. 分 离线 程 


每 个 线程 有 一 个 可 结合 (ioinable)/ 可 分 离 (detached) 属 性 。 一 个 可 结合 的 线程 能 够 被 其 他 线程 杀 死 
并 收回 其 资源 。 在 被 其 他 线程 回收 之 前 ， 它 的 存储 器 资源 (例如 栈 ) 没 有 被 释放 。 相 反 ， 一 个 可 分 离 
的 线程 是 不 能 被 其 他 线程 回收 或 杀 死 的 ， 它 的 存储 器 资源 在 其 终止 时 由 系统 自动 释放 。 

线程 被 创建 时 是 可 结合 的 。 为 避免 存储 器 泄漏 ， 每 个 可 结合 的 线程 都 应 该 由 其 他 线程 通过 调用 
pthread join 函数 显 式 地 收回 ， 或 通过 自身 调用 pthread _detach 函数 被 分 离 。pthread_detach 函数 需要 
的 参数 线程 tid 可 通过 调用 pthread_self0 函 数 获得 。 


返回 ; 若 成 功 ， 则 返回 0， 若 失败 ， 返 回 非 零 值 。 
很 多 应 用 场景 需要 使 用 可 分 离 的 线程 。 例 如 ， 一 台 高 性 能 Web 服务 器 可 能 在 每 次 收 到 Web 浏 
览 器 的 连接 请 求 时 都 创建 一 个 新 的 对 等 线程 ， 以 独立 处 理 与 该 浏览 器 的 通信 ， 服 务 器 不 必 显 式 地 等 
待 对 等 线程 终止 。 这 种 情况 下 ， 就 可 将 每 个 对 等 线程 设置 成 可 分 离 的 线程 ， 使 其 终止 后 自动 释放 


5. 初始 化 线程 
pthread once 函数 用 以 初始 化 与 线程 例 程 相关 的 状态 。 


#include<pthread h> 
pthread_once tonce_control =PTHREAD ONCE INIT: 
int pthread_once(pthread_once_t *once_control, void (*init_routine\(void)); 
返回 : 车 成 功 ， 则 返回 0; 若 失败 ， 返 回 非 零 值 。 


once_control 是 一 个 全 局 变量 或 静态 变量 ， 通 常设 置 为 PTHREAD ONCE INIT。 第 一 个 线程 用 
参数 once_control 调用 pthread_once 时 ， 调 用 init routine 以 执行 某 些 初始 化 工作 。 接 下 来 其 他 线程 
执行 以 once_control 为 参数 的 pthread_once 调用 时 ， 将 不 做 任何 事情 。pthread_once 函数 一 般 用 于 动 
态 初 始 化 多 个 线程 共享 的 全 局 变量 。 

下 面 安排 一 些 思考 题 ， 练 习 使 用 pthread_create、pthread jom、pthread_exit 的 基本 编程 方法 ， 
pthread detach 和 pthread_once 的 应 用 示例 见 本 书后 面 章节 。 
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好 = 思考 与 练习 题 6.1 编写 一 个 多 线程 程序 ptheadexl.c, 主线 程 先 创建 3 个 分 别 输出 “peer thread< 
对 等 线程 TID>”3 次 、4 次 、5 次 的 对 等 线程 ， 然 后 自己 输出 “main thread < 主线 程 TID>” 两 次 ， 
最 后 调用 pthread join 等 待 三 个 对 等 线程 终止 。 运 行 该 程序 ， 测 试 其 正确 性 。 注 释 掉 pthread join 语 
外， 再 看 看 输出 结果 是 否 正确 ， 并 解释 原因 。 
有 ”思考 与 练习 题 6.2 阅读 下 面 的 多 线程 程序 pthreadbug.c， 对 等 线程 睡眠 1 秒 钟 后 输出 一 个 字符 串 。 
广 pthreadbug.c 源 代码 */ 
1 #include "wrapper.h" 


2 void*peerthread(void *vargp); 
3 intmain0 

4  { pthread ttid: 

5 Pthread_create(&tid, NULL, peerthread, NULL): 
6 exit(0); 

we 

8 

9 。 void ypeerthread(void *vargp) 
10 { sleep(1); 

11 printf("Hello, worldi\n"): 
12 Tetum NULL: 

和 


A. 该 程序 存在 一 个 bug， 运 行 该 程序 没有 看 到 任何 输出 。 请 解释 原因 。 

B. 用 两 个 Pthreads 函数 可 替换 第 6 行 中 的 exit 函数 调用 ， 修 正 这 个 错误 。 请 写 出 这 两 个 函数 的 
正确 调用 形式 。 

C. 简单 地 去 掉 主 线程 的 exit(0) 语 句 ， 能 否 修正 这 个 错误 ， 请 试验 和 解释 原因 。 


6.2.2 ”多 线程 并 发 特征 


我 们 用 示例 程序 pthread2.c 进行 讨论 。 主 线程 给 全 局 变量 x 赋值 10， 然 后 创建 两 个 对 等 线程 ， 
分 别 计算 x 的 平方 和 平方 根 。 现 在 先 讨论 其 多 线程 并 发 特征 。 


诺 pthread2.c 源 代码 

编译 命令 为 gcc pthread2.c -o pthread2 -L. -lwrapper -lpthread -lm */ 
#include "wrapper.h" 

2 intx,rl; float* 72; 

入 void *thl(void *vargp) { 
4 int a=*((int*) vargp): 
5 rl=ata; 
6 

7 

8 

£1 


void *th2(void *vargp) { 
float* a=(float *)malloc(sizeof(float)): 
*a=sqrt(x):; 
10 pthread_exit((void *) a):; 
my 
12 ”intmain0 
3 
14 pthread t tl: 
15 X=10; 
16 Pthread_create(&t]. NULL. thl1, (void* )&x): 
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17 Ppthread_create(&t2, NULL. th2, NULL): 
18 pthread join(tl. NULL): 


19 pthread join(t2.(void **) &r2): 

20 Printf("x*x=%d root x=%f\n"r1,*72); 
21 free(r2); 

22 exit(0); 

3 


程序 启动 时 ， 系 统 创建 pthread2 进程 ， 其 进程 控制 块 PCB(Process Control Block) 包 括 PID、 程 
序 地 址 、 数 据 集 地 址 等 ， 数 据 集 包括 x、rl、z2 三 个 全 局 变量 。 程 序 启动 后 ， 系 统 在 进程 pthread2 
内 创建 main 线程 (主线 程 )， 两 个 pthread_create 函数 调用 创建 两 个 对 等 线程 tl 和 也。 每 个 线程 至 少 
包括 线程 控制 块 TCB(Thread Control Block) 和 线程 堆栈 两 部 分 ，TCB 用 于 管理 TID( 线 程 ID 号 )、 代 
码 地 址 等 线程 属性 信息 , 线程 堆栈 用 于 给 相应 线程 局 部 变量 分 配 内 存 地 址 (函数 的 形式 参数 也 属于 局 
部 变量 )， 图 6-3 显示 了 pthread2 的 进程 结构 。 


主线 程 main 代 码 pthread2 进 程 数据 集 (全 局 变量 ) 
int mainO ] En 
PID: 1234 x 10 

pthread t 代码 地 址 rl ? 
数据 集 地 址 Z| 
pthread a 
Pthread_create(&t2, NULL th2, NULL); AN 厂 ， 对 等 线程 4 | 对 等 线程 t2 
pthread_join(tl, NULL); TID: 1236 
| Be (a ei 3 TcB 
printf("x*x=%d root x=%fn",r1,+72); 

局 部 变量 
Eee Ms | 


exit(0); 


图 6-3 程序 pthread2.c 创建 两 个 对 等 线程 后 的 进程 结构 


主线 程 第 二 次 调用 pthread_create 创建 线程 t2 后 ， 三 个 线程 并 发 往 下 执行 ， 每 个 线程 的 当前 操 
作用 图 6-4 中 的 圆圈 指示 ， 三 段 并 发 代码 用 矩形 框 标 出 。 
e 在 多 处 理 器 系统 中 ， 三 个 逻辑 流 可 以 并 行 执行 ， 若 为 单 处 理 器 系统 ， 三 段 并 发 代码 以 任何 
交错 顺序 执行 都 是 可 能 的 。 
e 线程 t 的 两 个 操作 Al、A2 与 线程 也 的 三 个 操作 Bl、B2、B3 并 发 执行 ， 不 同 的 执行 顺序 
有 CC? =10 种 之 多 。 
e 操作 tl:Al 和 也 :B2 都 需要 读 变量 x 的 值 (后 面 进行 分 析 )， 访 问 相同 的 内 存单 元 ， 可 不 严格 
地 认为 这 两 个 操作 会 错开 执行 。 实 际 上 ， 涉 及 相同 硬件 单元 部 件 的 操作 都 会 错开 执行 。 
e 虽然 主线 程 的 pthread_join 函数 调用 与 对 等 线程 并 发 执行 ,但 会 等 到 相应 的 线程 结束 后 返回 ， 
因此 主线 程 的 printf 语句 并 不 与 线程 上 、 也 并 发 。 
进程 内 的 每 个 线程 都 是 一 个 逻辑 流 ， 因 此 进程 pthread2 有 三 个 逻辑 流 ，main 线程 、tl 线程 、 世 
线程 ， 这 三 个 逻辑 流 的 并 发 执行 情况 如 图 6-4 所 示 ， 尽 管 表达 不 太 严谨 ， 但 很 直观 。 
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主线 程 main 
int main() 
pthread t tl.t2; 
x=10; 
pthread_create(&tl. NULL, thl, (void*)&ex); 对 等 线程 tL 对 等 线程 t2 


Pthread create(&t2, NULL, th2, NULL): 
void *th2(void +vargp) { 
@B1:float* a=(float *)malloc(sizeof(fioat)); 
B2:*a=sqrt(x); 
B3:pthread_exit((void *) a); 


@@ pthread join(t1, NULL); 


pthread_join(t2,(void **) &r2): IC 


@ Alinta=*((int*) vargp); 


A2:rl=a*a; 


} 


} 


Printf("x*x=%d root x-%f\n" 1,*72); 
free(r2); 
exit(0); 

} 


6-4 ”pthread2.c 中 三 线程 并 发 关系 图 


6.2.3 ”线程 间 数 据 传递 


进行 多 线程 编程 要 考虑 的 一 个 重要 问题 是 ， 要 合理 安排 主线 程 和 对 等 线程 的 工作 分 工 ， 一 般 主 
线程 经 常 需要 准备 好 待 处 理 数 据 ， 并 通过 特定 方式 传递 给 对 等 线程 ， 对 等 线程 完成 其 任务 后 ， 需 要 
将 处 理 结果 传 回 主线 程 汇总 。 

根据 线程 特性 和 线程 API 函数 的 定义 ， 主 线程 和 对 等 线程 间 进行 数据 传递 的 方式 有 三 种 : 

e@ 利用 pthread create 函数 的 第 四 个 参数 。 主 线程 可 将 一 个 void* 指 针 类 型 的 值 传递 给 对 等 线 

程 ， 通 过 这 个 指针 参数 ， 可 将 整 型 值 、 字 符 串 、 数 组 、 结 构 体 、 联 合体 等 各 种 类 型 的 数据 
传递 给 对 等 线程 。 

e 通过 全 局 变量 。 进 程 中 的 所 有 信息 都 是 对 线程 进行 共享 的 ， 包 括 全 局 变量 ， 但 多 个 线程 对 

共享 的 全 局 变量 进行 并 发 访问 时 ， 需 要 考虑 如 何 解决 同步 和 互 斥 问题 。 

e@ 通过 pthread exit 函数 的 参数 。 对 等 线程 通过 pthread_exit 函数 可 将 一 个 void* 类 型 的 指针 值 

传递 给 pthread join 函数 。 

以 程序 pthread2.c 为 例 ， 线 程 间 的 数据 传递 方法 如 图 6-5 所 示 ， 主 线程 将 数据 传递 给 线程 t,， 这 
是 通过 pthread_create 函数 的 第 四 个 参数 来 实现 的 。 主 线程 的 M2 行 以 数据 变量 x 的 地 址 为 第 四 个 参 
数 调 用 pthread_ create 来 创建 线程 t, 了 hl 的 形式 参数 vargp 获得 一 个 指向 变量 x 的 指针 值 &x( 即 变量 
x 所 在 单元 地 址 )，Al 操作 a=*(int *) vargp 实际 上 等 价 于 a=*(&x)， 也 就 是 a=x， 即 将 变量 x 共享 给 
线程 t] 访问 。 采 用 pthread_ create 传递 数据 的 灵活 性 非常 强 ， 可 将 全 局 变量 、 主 线程 局 部 变量 甚至 
静态 变量 共享 给 对 等 线程 访问 ， 共 享 的 变量 可 以 是 任何 类 型 ， 包 括 整 型 、 浮 点 型 、 数 组 、 结 构 体 、 
联合 体 等 ， 当 然 也 可 以 直接 将 整数 值 作为 指针 传递 给 对 等 线程 。 对 等 线程 t1 将 结果 传 回 主线 程 ， 这 
是 通过 全 局 变量 rl 来 实现 的 ，tl 将 结果 赋予 变量 r1(A2 行 )， 主 线程 输出 显示 rl 的 内 容 (M6 行 )。 

主线 程 传递 数据 给 线程 也 ,这 是 直接 通过 全 局 变量 x 来 实现 的 ,但 结果 的 传 回 是 利用 pthread_exit 
函数 的 参数 来 完成 的 。 主 线程 用 pthread join 等 待 对 等 线程 执行 pthread_exit 结束 ，pthread_exit 的 参 
数 被 传递 给 pthread join 的 第 2 个 参数 所 指向 的 单元 ， 因 此 本 例 中 结果 的 传递 可 不 严谨 地 看 成 操作 
*(&r2)=a， 即 12=a。 这 样 12 获得 一 个 指向 运算 结果 单元 的 指针 ， 因 此 M6 行 可 用 *12 读 出 结果 值 进 
行 输 出 。 为 防止 内 存 泄漏 ， 主 线程 要 负责 释放 (M7 行 ) 对 等 线程 世 动态 申请 (B1 行 ) 的 内 存 块 。 同 样 ， 
采用 这 种 方式 ， 对 等 线程 可 将 任何 类 型 的 数据 传 回 主线 程 。 如 果 传 回 的 结果 只 是 整数 类 型 ， 可 直接 
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作为 指针 传递 ， 而 不 动态 申请 内 存 。 


$gcc pthread2c -0 pthread? -L. 


上 线程 main 


int x rl; float* 12; 
int main() 


pthread t tl.2: 
Ml:x=10: 

M2:pthread ereate(&t], NULL, thl, (void*)@& 
M3:pthread_ create(&t2, NULL. th2, NUELL): 


M4: pthread_join(tl, NUEL); 
M5: pthread__join(t2,(void ie 


M6:printf("x*x=%d mot x=%fn" rl,*r2); 
M7-:free(r2); 
exit(0): 


void *thl(void *vargp) { 


对 等 线程 tL 


void wihavoid wvarep) 
Bl-float* a-(float *)malloc(sizeoftfload)): 
B2:*a=sqrt(x); 对 等 线程 
B3:pthread exit((void *)a ); 
} 


*(&r2)=a 
即 r2=a 


图 6-5 pthread2.c 中 的 线程 问 数据 传递 
现在 编译 和 运行 该 程序 ， 验 证 执行 结果 : 


$./pthread? 
x*x=100 root x=3.162278 


下 面 再 给 出 


通过 全 局 变量 传递 给 对 等 线程 tid2 输出 显示 。 


旋 pthread3.c 源 代码 ， 


gccpthread3.c -opthread3 -L. -lwrapper -lpthread */ 


#include "wrapper.h" 
typedef struct student 


{ 


int age; 
char name[20]: 


}STU; 


STU stu; 


pthread ttidl, tid2; 


void *tl(void *arg) { 


stu.age = 20; 
strepy(stu.name. "Zhang Ming"): 


void *t2(void *arg) 


{ 


pthread join(tidl. NULL): 

Printf("The following is transferred to thread\n"): 
Printf("STU age is %d\n", stu.age): 

Printf("STU name is %s\n", stu.name): 


int main(int argc. char *arev{]) 


-wrapper -lpthread -lm 


一 个 线程 间 数 据 传递 示例 pthread3.c, 它 创建 两 个 线程 , 在 线程 tidl 中 输入 学 生 信息 ， 


这 是 一 个 通过 全 局 变量 传递 结构 体 的 线程 编程 示例 ， 编 译 命令 为 
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26 { 

27 pthread create(&tidl, NULL,t1, NULL): 
28 pthread create(&tid2, NULL, 12, NULL): 
29 pthread join(tid2, NULL):; 

30 } 


对 STU 结构 体 的 赋值 操作 应 该 在 前 ， 输 出 操作 应 该 在 后 。 在 线程 世 的 起 始 处 (第 19 行 ) 安 排 
pthread join 调用 等 待 线程 t 结束 , 保证 线程 妃 对 变量 stu 的 读 取 操作 在 t1 对 变量 stu 的 赋值 操作 之 
后 。 在 这 里 ，pthread join 实际 上 承担 了 线程 同步 功能 ，Pthreads 还 提供 了 多 种 专用 的 同步 API， 这 
些 将 在 后 面 介绍 。 

下 面 编译 执行 该 程序 : 

Sgcc -0 pthread3 pthread3.c -L. -Iwrapper -lpthread 

S$ pthread3 

The following is transferred to thread 

STUageis20 

STU name is Zhang Ming 
坎 = 思考 与 练习 题 6.3 说 明 6.1.4 节 中 pthreadl.c 主 线程 和 对 等 线程 交错 显示 输出 的 原因 。 

旨 ”” 思考 与 练习 题 6.4 ”改写 程序 pthread3.c， 仅 创建 一 个 对 等 线程 ， 由 父 进程 输入 学 生 信息 ， 
对 等 线程 输出 学 生 信息 ,主线 程 通 过 pthread_create 的 第 4 个 参数 STU 结构 体 传 递 给 对 等 线程 。 


前 面 的 示例 程序 中 ， 主 线程 可 通过 变量 共享 的 方式 与 对 等 线程 传递 数据 。 从 程序 员 的 角度 看 ， 
多 线程 编程 的 主要 优势 是 线程 之 间 共 享 程序 变量 十 分 方便 。 但 是 ， 变 量 共享 处 理 不 好 ， 也 会 带 来 很 
多 问题 。 要 编写 正确 的 线程 化 程序 ， 有 必要 对 变量 共享 的 概念 有 个 比较 清晰 的 了 解 。 

首先 我 们 需要 辨别 一 个 程序 中 哪些 变量 是 多 线程 共享 的 。 由 于 线程 共享 进程 的 地 址 空间 ， 我 们 
首先 需要 明确 进程 的 用 户 地 址 空间 结构 和 运行 实例 这 两 个 概念 。 一 个 变量 是 共享 的 ， 当 且 仅 当 多 个 
线程 引用 这 个 变量 的 某 个 实例 时 。 

为 便于 理解 ， 下 面 通过 程序 示例 sharvar.c 来 进行 讨论 ， 该 程序 由 一 个 主线 程 和 两 个 对 等 线程 组 
成 。 在 该 程序 中 ， 主 线程 传递 一 个 线程 TID 给 每 个 对 等 线程 ， 每 个 对 等 线程 利用 这 个 TID 输出 一 条 
信息 ， 并 显示 该 线程 例 程 的 调用 次 数 。 


上 #sharvarc 是 线程 间 共 享 变量 的 典型 示例 ， 编 译 命令 为 
gcc -0 sharvar sharvarc -lpthread */ 

1 #include "wrapper.h" 

2 #define N 2 

void *thread(void *vargp): 

4 char**ptr: 

] intmain0 

| 

yr inti; 

8 pthread ttid: 
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9 char *mesgs[N]={ 
10 "Helloto thread 0", 

11 "Hello to thread 1" 

i 1 

13 

14 ptr = mesgs: 

15 forG=0i<N:ith 

16 pthread_ create(&tid NULL., thread, (void Di: 
17 pthread_exit(0); 

JE 

19 

20 void *thread(void *vargp) 

3 

22 int mytid = (int)vargp; 

23 static int cnt = 0; 

24 Cnttt; 

25 Printf("[%d]: %s (cnt=%d)\n", mytid, ptrfmyid], cnt); 
26 Tetum; 

Zt 


6.3.1 进程 的 用 户 地 址 空间 结构 


并 发 线程 运行 在 一 个 进程 的 上 下 文中 ， 每 个 线程 都 有 包括 线程 ID、 线程 堆栈 、 栈 指针 、 程 序 计 
数 器 、 条 件 码 和 通用 寄存 器 值 在 内 的 独立 线程 上 下 文 。 由 于 堆栈 具有 后 进 先 出 特性 ， 符 合 函数 调用 
特性 ， 因 此 系统 给 每 个 线程 设置 一 个 专用 堆栈 ， 用 于 给 形式 参数 、 返 回 值 、 局 部 变量 分 配 内 存 。 进 
程 内 的 所 有 线程 一 起 共享 进程 上 下 文 的 剩余 部 分 ,这 包括 进程 的 用 户 地 址 空间 (或 称 虚拟 地 址 空间 )， 
它 由 进程 可 访问 的 所 有 存储 位 置 构成 。 这 里 所 指 的 存储 地 址 (或 位 置 ) 并 非 真正 的 存储 器 地 址 ， 而 是 


程序 地 址 (或 逻辑 地 址 )， 程 序 地 址 在 执行 指令 时 由 地 址 转换 机 构 翻 译 成 物理 地 址 。 


图 6-6 给 出 了 Linux 环境 下 进程 的 用 户 地 址 空间 结构 ， 它 包括 只 读 存 储 段 (程序 代码 所 在 的 text 
段 和 只 读数 据 所 在 的 rodata 段 )、 读 写 数据 段 (已 初始 化 全 局 变量 所 在 的 data 段 和 未 初始 化 全 局 变量 
所 在 的 bss 段 )、 存 储 堆 (动态 申请 存储 器 分 配 的 地 址 区 间 )、 用 户 栈 (给 局 部 变量 分 配 内 存 的 地 址 区 间 ) 


以 及 所 有 的 共享 库 代 码 和 数据 所 在 区 域 。 不 同 进程 的 用 户 地 址 空间 可 以 重 又 或 重合 。 


0xC00000000 


esp 
( 栈 顶 ) 


~ 一 btk 

卖 写 数据 从 可 

该 扫 和 

[Er 并 

Ox08048000 该 存 情 段 aa 获 入 
0 


图 6-6 用 户 地 址 空间 结构 
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由 于 所 有 线程 共享 进程 的 整个 地 址 空间 ， 从 理论 上 讲 任何 线程 都 可 利用 变量 指针 访问 整个 用 户 
地 址 空间 的 任意 位 置 。 如 果 一 个 线程 修改 某 个 存储 器 位 置 的 内 容 ， 那 么 其 他 线程 都 可 读 出 这 个 存储 
器 位 置 的 值 。 在 示例 程序 sharvar.c 的 第 25 行 ， 对 等 线程 就 通过 全 局 变量 ptr 间接 引用 了 主线 程 的 堆 
栈 中 数组 变量 mesgs 的 内 容 。 


6.3.2 ”变量 类 型 和 运行 实例 


在 Linux 系统 中 ， 多 线程 程序 中 的 变量 根据 它们 的 存储 类 型 被 映射 到 虚拟 存储 器 (进程 地 址 空间 ): 

e 全 局 变量 。 全 局 变量 是 定义 在 函数 之 外 的 变量 ， 被 分 配 到 进程 虚拟 存储 器 (进程 地 址 空间 ) 
的 可 读 写 数据 区 域 (data 段 、bss 段 )。 每 个 全 局 变量 只 有 一 个 运行 实例 ， 任 何 线程 都 可 以 引 
用 ， 是 一 种 最 典型 的 变量 共享 方法 。 例 如 ，sharvar.c 的 第 4 行 声明 的 全 局 变量 ptr 就 在 虚拟 
存储 器 的 读 / 写 区 域 中 有 一 个 运行 实例 ， 各 个 线程 都 可 访问 。 当 一 个 变量 只 有 一 个 实例 时 ， 
我 们 直接 用 变量 名 (在 这 里 是 pt) 表 示 这 个 实例 。 

。 本 地 自动 变量 。 本 地 自动 变量 是 定义 在 函数 内 部 但 没有 static 属性 的 变量 。 函数 未 被 调用 时 ， 
系统 不 给 自动 变量 分 配 内 存 。 当 函数 (或 例 程 ) 被 某 个 线程 调用 时 ， 系 统 就 在 线程 堆栈 中 为 函 
数 的 所 有 本 地 自动 变量 创建 一 个 运行 实例 。 若 多 个 线程 调用 了 同一 个 函数 (或 例 程 )， 该 函数 
中 的 自动 变量 就 会 拥有 多 个 运行 实例 ， 分 别 位 于 各 调用 线程 堆栈 中 ， 这 里 用 变量 名 .线程 名 
的 形式 来 表示 每 个 运行 实例 。 例 如 ，sharvar.c 中 的 本 地 变量 tid 有 一 个 实例 ， 它 位 于 主线 程 
运行 栈 中 , 用 tidm 表示 这 个 实例 。 本 地 变量 myid 有 两 个 实例 ,一 个 在 对 等 线程 to 的 栈 内 ， 
另 一 个 在 对 等 线程 tl 的 栈 内 。 这 里 将 这 两 个 运行 实例 分 别 表示 为 myidt0 和 myid.t1。 

e 本 地 静态 变量 。 本 地 静态 变量 是 定义 在 函数 内 部 并 且 有 static 属性 的 变量 。 和 全 局 变量 一 样 ， 
函数 (或 例 程 ) 中 声明 的 每 个 本 地 静态 变量 仅 有 一 个 运行 实例 , 位 于 虚拟 存储 器 的 可 读 写 区 域 
(data 段 、bss 段 )。 例 如 ， 示 例 程序 sharvar.c 的 函数 thread 在 第 23 行 用 static 声明 的 本 地 静 
态 变 量 cnt， 就 只 有 一 个 运行 实例 ， 位 于 用 户 地 址 空间 的 读 / 写 数据 段 ， 每 个 调用 函数 thread 
的 对 等 线程 都 读 写 这 个 运行 实例 。 


6.3.3 ”共享 变量 的 识别 


称 某 个 变量 为 共享 变量 ， 当 且 仅 当 它 的 一 个 运行 实例 被 一 个 以 上 的 线程 引用 时 。 例 如 ， 示 例 程 
序 sharvar.c 中 的 静态 变量 cnt 就 是 共享 变量 ， 因 为 它 只 有 一 个 运行 实例 ， 并 且 这 个 运行 实例 被 两 个 
对 等 线程 tL、t 引用 。 变 量 myid 却 不 是 共享 变量 ， 因 为 它 的 两 个 实例 myidt0、myidl 都 只 被 一 个 
线程 引用 。mesgs 数组 虽然 是 主线 程 的 本 地 自动 变量 , 但 却 通过 全 局 指针 ptr 同时 被 两 个 对 等 线程 引 
用 。 多 线程 对 共享 变量 执行 并 发 访问 ， 可 能 会 影响 到 程序 执行 结果 的 正确 性 。 因 此 ， 在 多 线程 编程 
中 ， 需 要 识别 程序 中 的 所 有 共享 变量 ， 并 对 有 关 访 问 操作 进行 协调 ， 以 保证 程序 正确 运行 。 

和 ”思考 与 练习 题 6.5 分 析 6.3 节 开 头 的 程序 sharvar.c。 

(1) 如 果 约 定 自动 变量 的 运行 实例 用 符号 vt 表示 ，v 为 变量 名 ，t 为 线程 各， 可取 m( 主 线程 )、 
t0( 对 等 线程 0) 或 (对 等 线程 1), 表示 该 运行 实例 驻 留 在 线程 t 的 本 地 栈 中 , 请 问 程序 的 每 个 变量 有 
哪些 运行 实例 ， 如 何 表示 。 

(2) 每 个 运行 实例 被 哪些 线程 引用 ? 

(3) 程序 中 有 哪些 共享 变量 ? 
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[到 线程 同步 与 互 斥 


虽然 前 面 给 出 的 示例 程序 使 用 共享 变量 在 主线 程 与 对 等 线程 间 传 递 数据 ， 但 由 于 主线 程 和 对 等 
线程 访问 共享 变量 的 操作 完全 错开 ， 没 有 并 发 访问 ， 程 序 的 执行 结果 正确 且 唯一 。 因 此 ， 不 需要 对 
操作 共享 变量 的 代码 进行 特殊 处 理 , 这 一 点 很 容易 理解 。 但 如 果 多 个 线程 对 共享 变量 并 发 执行 操作 ， 
就 可 能 引入 同步 错误 (synchronization error)。 本 节 探 讨 这 个 问题 ， 给 出 如 何 对 并 发 操作 进行 协调 ， 以 
保证 程序 运行 结果 的 正确 性 。 


6.4.1 变量 共享 带 来 的 同步 错误 


1. 多 条 语句 并 发 操作 共享 变量 


我 们 来 看 一 下 火车 票 售票 模拟 程序 tcketsl.c。 假设 售票 厅 有 两 个 窗口 可 发 售 某 日 某 次 列车 的 10 
张 车 票 ， 这 时 ，10 张 车 票 可 看 成 共享 资源 ， 剩 余 票数 tickets 是 共享 变量 ， 两 个 售票 窗口 表示 两 个 线 
程 ， 通 过 一 个 循环 ， 每 次 打印 一 次 票 号 ， 并 将 余 票 数 减 一 ， 表 示 售 票 一 张 ， 直 到 卖 完 为 止 。 

让 多 线程 并 发 读 写 共享 变量 引起 错误 的 第 一 个 示例 程序 tickets1.c， 编 译 命令 为 

gcc -0 ticketsl ticketsl.c -lpthread */ 


1 #include “wrapper.h" 

2 inttickets=10; 

3 void *counter(void *); 

4 intmain(intargc, char **argv) 
6 

学 

8 

时 


pthread t tid[5]; 

int 荆 

for(=1 ;i<=2; i++H) 

pthread_create(&tid[],NULL. counter, (void*)i); 

10 
11 for(E=] ;i<=2; i 寺 +H) 
12 Pthread_join(tid[i], NULL); 
13 pthread_exit(0): 
i 
15 -void*counter(void *no) 
16 
| 
18 while(tickets>0) { 
19 printf(" 柜 台 %d 卖 出 一 张 票 ， 票 号 为 %d\n", (int)no. tickets): 
20 usleep(1): 
21 tickets 一 : 
22 usleep(1): 
23 } 
24 } 
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下 面 编译 执行 该 程序 : 


Sgce -0 ticketsl ticketsl.c -lpthread 


S$ Mickets1 


柜台 1 卖 出 一 张 票 ， 
柜台 1 卖 出 一 张 票 ， 
柜台 2 卖 出 一 张 票 ， 
柜台 1 卖 出 一 张 票 ， 
柜台 2 卖 出 一 张 票 ， 
柜台 1 卖 出 一 张 票 ， 
柜台 2 卖 出 一 张 票 ， 
柜台 1 卖 出 一 张 票 ， 
柜台 2 卖 出 一 张 票 ， 
柜台 1 卖 出 一 张 票 ， 


结果 好 像 不 正确 ， 现 在 分 析 执 行 结果 与 产生 原 
@ 两 个 售票 窗口 交叉 卖 出 车 票 


票 号 为 10 
票 号 为 9 
票 号 为 8 
票 号 为 8 
票 号 为 6 
票 号 为 6 
票 号 为 4 
票 号 为 4 
票 号 为 2 
票 号 为 2 


因 


这 是 正常 的 ， 因 


@ 程序 的 运行 结果 是 错误 的 ， 2、4、6、8 号 车 
为 让 读者 更 好 地 理解 程序 出 错 原 因 , 我 们 将 线程 中 操作 共享 变量 tickets 的 两 条 语句 用 标号 S、T 


标 出 : 


A 


S: printfo" 柜 台 %d 卖 出 一 张 票 ， 票 号 为 %d\n", (int)no, tickets); 


T: tickets-; 


为 它们 代表 的 两 个 线程 是 并 发 执行 的 。 
票 被 卖 出 两 次 ， 而 1、3、5、7 号 车 票 未 卖 出 。 


线程 1 的 这 两 条 语句 分 别 记 为 S1、T1， 线 程 2 的 这 两 条 语句 分 别 记 为 S2、T2。 由 于 语句 S 和 
T 之 后 都 有 一 条 usleep 语句 (第 20、22 行 )， 导 致 线程 放弃 CPU， 因 而 发 生 上 下 文 切换 ， 控 制 被 转移 
到 另 一 个 线程 ， 因 此 两 个 线程 的 S、T 语句 以 各 种 交错 顺序 执行 都 是 可 能 的 ， 虽 然 不 同 交 错 模 式 的 
发 送 概率 可 能 有 所 不 同 。 用 数学 方法 进行 探究 , 可 以 发 现 , S 和 T 工 两 条 语句 交错 执行 有 (Sl1、T1、S2、 
To (1s 8 Tl To GL 2 Ta TI (2 Ss TL To. EB Sl Ts TI GG Ts 
S1、T1D) 六 种 模式 。 假 设 现在 tickets=8， 两 个 线程 按 不 同 模式 执行 S、T 的 结果 如 表 6-1 所 示 。 


表 6-1 tickets1.c 中 第 18、20 行 语句 的 执行 情况 


模式 1 模式 5 结果 
sl sl s 
Tl ticket=7 台 2 卖 出 票 号 8 sl 
S2 柜台 2 卖 出 票 号 7 S2 
六 T2 
模式 2 模式 6 结果 
S2 柜台 2 卖 出 票 号 8 sl 
T2 ticket=7 S2 
Sl 台 1 卖 出 票 号 7 最 
三 ticket=6 到 


读者 可 自行 完成 模式 4~ 模 式 7 中 各 条 语句 的 执行 结果 。 从 手工 执行 结果 来 看 ， 两 个 线程 按 模式 
1 和 模式 2 执行 ， 程 序 运行 结果 正确 ; 按 模式 3~ 模 式 6 执行， 程序 运行 结果 中 出 现 了 同步 错误 ， 票 
号 为 8 的 车 票 被 卖 出 两 次 。 从 语句 模式 的 特点 来 看 ， 两 个 线程 中 操作 共享 变量 的 语句 完全 错开 执行 
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(模式 1 和 模式 2)， 程 序 运行 结果 就 是 正确 的 ， 两 个 线程 中 操作 共享 变量 的 语句 交错 执行 (模式 3~ 模 
式 6)， 程 序 运行 结果 出 错 了 。 

由 此 我 们 得 到 一 个 结论 : 在 多 线程 并 发 读 写 共享 变量 的 情况 下 , 若 不 对 各 线程 的 行为 加 以 限制 ， 
则 可 能 导致 同步 错误 ， 若 能 保证 各 线程 操作 共享 变量 的 代码 序列 完全 错开 执行 (或 称 互 斥 执行 )， 则 
可 避免 同步 错误 发 生 。 

实际 上 ， 即 使 我 们 删 去 第 20、22 行 的 usleep 语句 ， 两 个 线程 的 S、T 语句 也 仍然 可 能 以 各 种 交 
错 模式 执行 ， 只 是 出 错 的 发 生 概率 变 小 而 已 。 因 为 即使 线程 执行 S、T 语句 后 ， 不 主动 放弃 CPU 控 
制 ， 但 由 于 任何 计算 机 都 有 定时 中 断 ， 也 会 每 隔 若 干 微 秒 产生 一 次 时 钟 中 断 ，CPU 响应 时 钟 中 断 ， 
在 此 过 程 中 ， 可 能 发 生 线程 上 下 文 切 换 ， 线 程 会 被 动 地 失去 CPU 控制 。 
只 思考 与 练习 题 6.6 填写 表 6-1 中 模式 4 模式 6 中 各 条 语句 的 执行 结果 。 


“2. 单条 语句 并 发 访问 共享 变量 


让 多 个 线程 访问 同一 共享 变量 的 操作 序列 交错 执行 可 能 导致 运行 错误 结果 ， 而 有 时 对 共享 变量 
的 操作 仅 为 一 条 简单 的 加 1 操作 语句 (如 cnt++)， 这 仍 有 可 能 使 程序 运行 出 错 ， 因 为 一 条 简单 的 语句 
往往 要 编译 成 多 条 汇编 语言 指令 ， 程 序 出 错 由 操作 共享 变量 的 多 条 指令 序列 交错 执行 导致 。 

考虑 下 面 的 示例 程序 badcountc， 它 创建 两 个 线程 ， 分 别 在 一 个 循环 中 对 共享 计数 变量 cnt 做 加 
1 和 减 1 操作 。 因为 循环 次 数 相 同 , 所 以 cnt 的 正确 结果 是 0。 然 而 , 当 在 Linux 系统 上 用 较 大 的 niters 
变量 值 运行 badcount.c 时 ， 有 时 会 得 到 错误 的 结果 ， 甚 至 每 次 得 到 的 结果 也 是 不 同 的 。 


久 多 线程 并 发 读 写 共享 变量 引起 错误 的 第 二 个 程序 示例 badcountc， 编 译 命令 为 
gcc -0 badcount badcountc -lpthread #/ 


#include "wrapper.h" 

Void *increase(void *arg): 

Void *decrease(void *+arg): 

int cnt =0; 上 # 全 局 共享 变量 */ 


int main(int argc, char **argv) 
{ 

unsigned int niters; 
9 pthread ttidl. tid2: 


11 iflargc!=2) { 上 # 检查 命令 行 参数 的 合法 性 */ 

12 Printf("usage:%s <niters>\n".argv[O0]): 

13 exit(2): 

4 

15 niters=atoll(argv{[1]): 此 将 字符 串 argv[1] 转 换 成 long long 类 型 *#/ 


17 ”上 # 创建 线程 并 等 待 其 终止 */ 
18 pthread_create(&tid1. NULL. incease, (void*) niters): 
19 pthread_create(&tid2. NULL. decrease. (void*) niters): 
20 pthread join(tid1. NULL): 
21 pthread join(tid2, NULL): 


23 让 (cnt !=0) 族 验证 结果 所 
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24 printf(“Error! cnt=%d\n", cnb: 
25 else 

26 Printf("Correct cnt=%d\n", cnt): 
py exit(0): 

2 

29 

30 void *increase(void *vargp) 

| 

32 Unsigned i niters=( unsigned int ) Vargp: 
< for (i=0:i<niters: 计 +) 

34 cntt 

35 Tetum NULL; 

< 

37 

38 void*decrease(void *vargp) 

39 

40 unsigned int initers=( unsigned int ) Vargp: 
41 forG=0:i<niters: it+) 

42 Cnt—; 

43 retum NULL; 

3 


编译 执行 结果 如 下 : 


Sgcec -0 badcount badcountc -lpthread 


$ .badcount 1000000 
OK cnt=0 

$ /badcount 10000000 
BOOM! cnt=4992727 

$ /badcount 10000000 
BOOM! cnt=3569685 

$ /badcount 10000000 
BOOM! cnt=5536837 


那么 哪里 出 错 了 呢 ? 为 了 清晰 地 理解 这 个 问题 。 我 们 需要 研究 计数 器 循环 (第 39 和 第 40 行 ) 中 的 


汇编 代码 ， 如 图 6-7 所 示 ， 这 是 


线程 tl 的 C 代 码 


将 线程 tl 的 循环 代码 分 解 成 五 部 分 。 


线程 i 的 汇编 代码 
(%rdi) .%oecX 
$0, %edx 2 
Yecx. Wedx | 也: 头 
cnt(%rip). %eax Ri 加 载 cnt 
eax Cr: 更 新 cnt 
Yoeax. cnt(%rip) 两: 存储 cnt 


96oecX. Wedx | i: 尾 


图 6-7 badcountc 中 计数 器 循环 (第 37 和 第 38 行 ) 的 汇编 代码 


e 友 : 循环 头 部 的 指令 块 对 循环 进行 初始 化 。 第 1 条 指令 “movl (%rdi), %ecx” 将 变量 niters 
的 指令 从 存储 器 取 到 寄存 器 %ecx 中 ， 第 2 条 指令 “movl $0, %edx” 将 0 赋值 给 表示 变量 


a2 


i 的 寄存 器 %edx 中 。 后 两 条 指令 对 变量 i 和 变量 niters 进行 大 小 比较 ， 以 决定 是 否 执行 循 
环 体 。 
Ri: 加 载 共享 变量 cnt 值 到 寄存 器 %eax; 的 指令 ， 这 里 %eax; 表 示 线 程 i 中 寄存 器 %eax 的 值 。 
Ci: 对 %eaxi 寄 存 器 中 的 值 做 递增 1 计算 。 
两: 将 9%eaxi 的 更 新 值 存 回 共享 变量 cnt。 
也 : 循环 尾部 的 指令 块 对 表示 变量 i 的 寄存 器 %edx 做 加 1 操作 ， 然 后 比较 i 是 否 小 于 变量 
niterso 

需要 注意 的 是 , 操作 cnt++ 已 被 翻译 成 RR、Ci 和 两 三 条 指令 。 由 于 线程 也 的 循环 代码 “for (i= 
0; i< niters; it+) ”cnt--;” 与 线程 t1 的 差别 仅仅 是 把 cntt+ 换 成 cnt--。 通 过 同样 分 析 不 难 理解 ， 将 图 
6-8 中 的 汇编 代码 C(“incl %eax”， 用 于 将 寄存 器 %eax 的 值 递增 1) 更 换 成 C(“decl %eax”， 
用 于 将 寄存 器 %eax 的 值 递 碱 D) 即 可 。 我 们 将 线程 刀 中 循环 (第 41、42 行 ) 的 汇编 代码 也 分 解 为 三 、 
R,、、Cy、 画 、 了 五 部 分 。 

两 个 对 等 线程 都 分 别 反复 执行 这 三 条 指令 ,对 共享 计数 器 变量 cnt 进行 读 写 访问 。 当 badcount.c 
中 的 两 个 对 等 线程 在 一 个 单 处 理 器 上 并 发 运行 时 ， 虽 然 单个 线程 上 的 机 器 指令 以 某 种 顺序 一 个 接 一 
个 地 执行 , 但 两 个 线程 的 指令 可 以 任意 顺序 交错 执行 (因为 每 条 指令 执行 后 , 可 能 发 生 中 断 导 致 CPU 
切换 到 其 他 线程 )。 如 果 为 线程 分 派 了 专用 的 CPU 或 CPU 核 ， 它 们 的 指令 并 行 执行 或 交错 执行 是 很 
自然 的 事情 。 

就 拿 线程 1 的 RR、Cl、 历 和 线程 2 的 RR、C,、 历 这 6 条 访问 全 局 变量 cnt 的 指令 来 说 ， 它 们 
的 执行 顺序 就 有 20 种 。 如 果 按 不 交叉 顺序 (RI、 Cl、 Wi、 Rs、 CG、 W) 和 (Rs、 CG、 Wy Ri、 Ci、 Wi) 
执行 ， 计 算 结果 就 是 正确 的 ; 若 按 其 他 顺序 执行 ， 结 果 就 不 正确 。 

例如 ， 图 6-9(a) 展 示 了 一 种 正确 的 指令 顺序 的 分 步 操作 。 假 设 cnt 的 初 值 是 9， 在 每 个 线程 执行 一 
次 循环 欠 代 以 更 新 共享 变量 cnt 之 后 ， 它 在 存储 器 中 的 实际 值 为 期 望 值 0， 代 码 执行 结果 正确 。 而 


图 6-9(b) 所 示 的 指令 顺序 会 产生 一 个 不 正确 的 cnt 值 ， 出 错 原因 是 ， 线 程 2 在 第 5 步 加 载 cnt， 是 在 第 2 
步 的 线程 1 加 载 cnt 之 后 , 在 第 6 步 的 线程 1 保存 更 新 值 之 前 , 每 个 线程 取 到 的 cnt 变 量 值 都 是 0。 因 此 ， 
每 个 线程 最 终 将 结果 1 更 新 到 计数 器 变量 cnt 中 。 
步骤 线程 指令  %eax!  %eax 线程 指令 %eaxl %eax。 cnt 
1 1 H - - i H 0 
2 1 Ri 0 1 Ri 0 0 
六 人 1 1 CO 1 0 
4 1 机 1 2 三 0 
要 2 A - RR - 0 0 
6 2 R 1 1 两 1 
2 G 0 & = -1 ¥ 
8 ] 现 0 2 殉 - -1 -1 
9 3 胞 0 tn - -1 -1 
10 i 五 1 2 五 1 -1 
四 ®) 
图 6-9 badcountc 中 第 一 次 循环 兴 代 的 指令 顺序 
虽然 不 同 顺序 出 现 的 概率 可 能 不 同 ， 比 如 按 不 交叉 顺序 Ri、C、 丙 、 尼 、C、FD) 和 CR 、C、 
静 、 玉 、C、 矶 ) 的 概率 一 般 比 较 大 ， 但 任何 执行 顺序 都 是 可 能 的 。 一 般 而 言 ， 我 们 没有 办 法 预 讽 
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线程 指令 的 执行 顺序 。 因 此 ， 程 序 的 执行 结果 有 时 正确 、 有 时 错误 。 
驹 * 思 考 与 练习 题 6.7 根据 badcount.c 的 指令 顺序 完成 表 6-2( 假 设 执行 前 cnt-0)。 


表 6-2 要 填写 的 表 
步骤 9%eax2 cnt 
1 0 
2 
3 
4 
5 
6 
学 
8 
9 
10 


这 个 程序 会 产生 正确 的 cnt 值 吗 ? 
移 ” * 思 考 与 练习 题 6.8 为何 niters 变 量 增 大 到 某 个 值 后 ,程序 badcount.c 的 执行 结果 开始 出 错 ? 
多 * 思 考 与 练习 题 6.9 在 图 6-9(b) 中 ， 导 致 线程 1 的 RI、C1、 三 条 相 邻 指令 在 执行 中 被 打 
断 ，CPU 转 去 执行 线程 2 的 相 邻 指令 RI、Cs、 了 现 的 可 能 原因 有 哪些 ? 

通过 以 上 分 析 不 难 获知 ， 导 致 运行 结果 不 正确 的 根本 原因 是 不 同 线程 对 共享 变量 cnt 的 操作 指 
令 被 交叉 执行 。 如 果 能 借助 某 种 设施 保证 一 个 线程 中 操作 共享 变量 cnt 的 三 条 指令 及、C、 形 全 部 
执行 完毕 后 ， 才 允许 另 一 个 线程 执行 访问 同一 全 局 变量 的 指令 序列 ， 就 总 能 得 到 正确 的 执行 结果 。 
这 种 限制 要 求 称 为 线程 互 斥 ， 而 实现 线程 互 斥 的 方法 称 为 同步 机 制 。 


6.4.2 ”临界 资源 、 临 界 区 、 进 程 (线程 ) 互 斥 问 题 


为 方便 问题 的 表述 ， 我 们 引入 临界 资源 和 临界 区 两 个 术语 。 临 界 资源 (Critical Resources) 是 为 多 
个 并 发 流 共用 ， 且 在 一 段 时 间 内 一 个 逻辑 流 (进程 或 线程 ) 需 要 独占 使 用 的 资源 ， 如 共享 变量 、 独 享 
设备 等 。 临 界 区 (Critical Section) 是 各 逻辑 流 操作 访问 临界 资源 的 代码 段 ， 如 图 6-8 所 示 。 


void reountervod pO) 临界 资源 ， 共 享 变量 、 共 用 资源 等 
{ while(1) 


1 
临界 区 ， 操 作 1 printft" 柜 台 %d 卖 出 一 张 票 ， 票 号 为 %d\n",(int)no. tickets): | 
临界 资源 的 代 usleep(1); 1 
码 序列 1 tickets--: | 

usleep(1): | 
1 


图 6-8 ticketsl.c 源 代码 中 的 临界 资源 和 临界 区 , 两 个 并 发 线程 执行 的 代码 都 是 函数 counter, 读 写 共享 变量 counter。 
因此 ，tickets 为 临界 资源 ， 图 中 框 出 的 代码 是 临界 区 
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一 般 情 况 下 , 两 个 并 发 逻辑 流 (进程 或 线程 ) 对 临界 区 代码 互 斥 执 行 的 要 求 就 可 表述 成 图 6-9 所 示 
的 情况 ， 仅 当 各 逻辑 流 的 临界 区 代码 完全 错开 执行 ( 互 斥 执行 ) 时 ， 才 是 正确 的 顺序 模式 。 我 们 需要 
设计 一 种 同步 机 制 ， 让 临界 区 代码 按 前 两 种 模式 执行 ， 防 止 第 三 种 情形 出 现 。 为 突出 主要 韦 盾 ， 在 
后 面 的 讨论 中 ， 我 们 直接 用 函数 表示 线程 、 进 程 等 并 发 流 ， 并 略 去 创建 进程 和 线程 的 代码 。 


情形 1: Ok 形 2: OK 情形 3: Error 
时 间 ”逻辑 流 1 ”逻辑 流 2 时 间 ”逻辑 流 1 ”逻辑 流 2 时 间 ”逻辑 流 1 ”逻辑 流 2 
i 
| | JE A- 


图 6-9 临界 区 代码 并 发 执行 的 三 种 情形 


6.4.3 用 信号 量 与 P/V 操作 保证 临 距 区 互 斥 执行 


解决 多 逻辑 流 互 斥 执行 临界 区 问题 的 基本 思路 是 ， 为 每 种 临界 资源 设置 一 种 许可 权 ( 或 称 令 牌 、 
互 斥 锁 )， 数量 为 1。 在 每 个 逻辑 流 的 临界 区 代码 前 增加 一 段 “ 进 入 区 ”代码 ， 用 于 获取 许可 权 ( 互 斥 
锁 )， 在 临界 区 代码 后 增加 一 段 “ 退 出 区 ”代码 ， 用 于 归还 临界 资源 许可 权 ， 如 图 6-10 所 示 。 接 下 
I 靠 的 同步 机 制 ， 这 是 解决 线程 (进程 ) 互 斥 问题 的 关键 。 
逻辑 流 A 


逻辑 流 B 
进入 区 (Entry Section) 进入 区 (Entry Section) 
<< 临 界 区 1>> << 临 界 区 2>> 

退出 区 (Exit Section) 退出 区 (Exit Section) 
<< 剩 余 代码 (remainder section>> << 剩 余 代码 (remainder section>> 


图 6-10 解决 ?个 并 发 流 互 斥 执行 临界 区 的 思路 ， 这 里 仅 给 出 两 种 逻辑 流 情形 


1. 基于 状态 变量 的 同步 机 制 


同步 机 制 的 设计 应 该 简单 、 高 效 、 易 用 ， 一 种 直观 的 方法 是 用 各 届 辑 流 共 用 的 一 个 特殊 锁 变量 
x 来 标识 临界 区 的 忙 闲 状态 。x=1 为 开锁 状态 ， 表 示 资 源 空闲 ，x=-0 为 上 锁 状态 ， 表 示 资 源 繁忙 ，x 
变量 也 可 看 成 一 个 计数 器 。 线 程 (进程 ) 进 入 临界 区 前 ， 必 须 请 求 上 锁 ， 先 测试 锁 状态 。 若 为 开锁 状 
态 ， 将 计数 器 减 1， 将 锁 置 为 “上 锁 ” 状 态 ， 获 得 锁 控制 权 ， 进 入 临界 区 ; 若 为 上 锁 状 态 ， 则 反复 
测试 ， 直 到 锁 被 打开 为 止 。 退 出 临界 区 时 ， 执 行 开锁 操作 ， 计 数 器 加 1， 将 锁 状态 置 为 “开锁 ” 状 
态 。 图 6-11 展示 了 基于 锁 变 量 解决 图 6-10 中 临界 区 互 斥 执行 问题 的 代码 框架 。 

¥ 3 逻辑 流 B: 
Thread BO { 


/请求 上 锁 lock(x) 


whileG—0)0; | J/; 
Ee // 请 求 上 锁 lock(x) 


<< 临 界 区 1>> << 师 界 

/| 开锁 unlock(x) /开锁 mmlockG) 
<< 其 余 代码 (remainder section)>> << 其 余 代 码 ( remainder section)>> 
} } 


图 6-11 基于 锁 机 制 解决 图 6-10 中 临界 区 互 斥 执行 问题 的 代码 框架 
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我 们 称 这 种 设计 方案 为 简单 锁 机 制 ， 它 在 多 数 情况 下 都 能 使 线程 互 斥 进入 临界 区 。 但 如 果 逻 辑 
流 A 执行 完 测试 操作 while(x 一 0){}， 还 未 来 得 及 执行 上 锁 操作 x=0， 逮 辑 流 B 也 执行 了 测试 操作 
while(x 一 0)， 由 于 x 的 初 值 为 1， 两 个 线程 都 会 退出 while 循环 ， 而 同时 进入 各 自 的 临界 区 ， 导 致 错 
误 。 一 个 程序 必须 在 所 有 情况 下 都 能 正确 执行 , 不 允许 存在 任何 例外 。 简单 锁 机 制 存在 这 样 的 漏洞 ， 
不 是 同步 机 制 的 正确 方案 。 
简单 锁 机 制 出 错 的 根本 原因 是 执行 请 求 上 锁 操 作 lock 时 , 锁 状 态 测试 与 上 锁 两 个 子 操作 是 分 开 
执行 的 ， 中 间 插 入 了 其 他 线程 的 锁 状态 测试 操作 。 如 果 我 们 能 将 锁 状态 测试 与 上 锁 两 个 子 操作 放 到 
一 条 指令 中 完成 ， 二 者 就 不 会 分 开 执 行 了 。 现 代 CPU 提供 了 “测试 设置 ”(Test-and-Set) 和 交换 两 种 
专用 硬件 指令 来 实现 这 样 的 功能 。 在 这 里 仅 讨论 如 何 用 测试 设置 指令 来 设计 同步 机 制 。 
“测试 设置 ”指令 TS(Test-and-Set) 在 单条 指令 中 完成 对 内 存单 元 中 内 容 的 检测 与 设置 ， 其 功能 
可 用 C++ 语法 中 带 引 用 参数 的 函数 定义 描述 如 下 : 
int TS(int &lock){ 
int state: 
state=lock; 
lock=0; 
Tetum state; 


} 


其 中 ，lock 为 表示 临界 资源 忙 亲 状态 的 标识 变量 ， 如 果 值 为 1， 表 示 临 界 资源 空 亲 ， 值 为 0 表 
示 临 界 资源 被 占用 。 执 行 TS 指令 后 ， 将 lock 标志 置 为 0， 并 以 lock 原 有 状态 为 返回 值 。 

图 6-12 是 利用 TS 指令 解决 图 6-10 中 临界 区 互 斥 执行 问题 的 代码 框架 。 由 于 TS(lock) 仅 为 一 条 
指令 ， 执 行 过 程 不 会 打 断 ， 无 论 多 线程 以 何 种 方式 并 发 执行 ， 仅 一 个 线程 执行 TS(lock) 指 令 后 返回 
1， 使 while 循环 条 件 为 false， 从 而 进入 临界 区 ， 其 他 线程 都 将 因 TS(lock) 指 令 返 回 0 而 使 while 循 
环 条 件 为 tue， 从 而 反复 进行 循环 测试 。 


intlock=1: /共享 锁 变量 的 定义 ， 初 值 为 开锁 状态 。 


while(!TS(lock)) {}; while(!TS(lock)) {}; 


《< 临界 区 1>> 《< 临界 区 2>> 
lock=1; lock=1; 

《< 剩余 代码 >> 《< 剩余 代码 >> 

} } 


图 6-12 基于 测试 设置 指令 (TS) 解 决 图 6-10 中 临界 区 互 斥 执行 问题 的 代码 框架 


基于 专用 硬件 指令 的 锁 机 制 成 功 解决 了 线程 的 临界 区 互 斥 执行 的 问题 ,是 一 种 正确 的 实现 方案 ， 
但 未 进入 临界 区 的 线程 循环 测试 锁 状态 , 浪费 宝贵 的 CPU 时 间 , 所 以 一 般 仅 适合 临界 区 代码 比较 简 
短 的 场合 , 在 操作 系统 内 核 中 运用 较 多 。 如 果 临 界 区 需要 较 长 的 CPU 时 间 , 还 需要 寻求 更 加 高 效 的 
同步 机 制 。 

2. 信号 量 与 P/V 操作 同步 机 制 | 


信号 量 (Semaphores) 机 制 是 由 荷兰 学 者 Dijkstra 提出 的 一 种 卓有成效 的 进程 同步 设施 , 其 本 质 是 
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一 种 封装 了 加 1 和 减 1 操作 、 可 防止 反复 测试 资源 可 用 状态 而 浪费 CPU 时 间 。 信号 量 机 制 的 基本 思 
想 是 : 当 临 界 资源 空闲 时 ， 让 请 求 进程 进入 临界 区 ， 而 当 临 界 资源 被 占用 时 ， 强 人 迫 请 求 进程 阻塞 ， 
避免 浪费 CPU 时 间 ; 并 要 求 从 临界 区 退出 的 进程 唤醒 因 请 求 临界 资源 而 被 阻塞 的 进程 ,使 其 进入 临 
界 区 。 

信号 量 是 一 种 表示 和 维护 可 用 资源 数量 的 计数 器 类 型 ， 可 描述 为 : 

typedef stmct _semaphore { 


int value; // 信 号 量 值 ， 表 示 可 用 资源 数 
WaitQueue L; /阻塞 队列 ， 等 待 资源 的 进程 队列 
} semaphore:; 


信号 量 结构 体 类 型 有 两 个 字段 ， 信 号 值 value 表示 可 用 资源 数 ， 队 列 工 是 因 请 求 资源 而 未 能 满 
足 的 挂 起 进程 等 待 队列 。 在 信号 量 之 上 定义 了 两 个 在 同一 信号 量 上 互 斥 执行 的 原 语 函 数 : P 操作 wait 
函数 和 VV 操作 signal 函数 ， 用 于 对 信号 值 做 安全 的 加 1 和 减 1 运算 , 语义 如 图 6-13 所 示 。 有 的 教材 
和 文献 将 P/V 操作 函数 写成 P(S)/V(S)。 


primitive wait(semaphore &S) //P 操 作 primitive signal(semaphore &S) //V 操作 
{ 


S.value=S.value+1; /站 可 用 资源 数 加 1*/ 


if(S.value—0) 
block(S.L): 。 /* 在 队列 S.L 中 挂 起 #/ 这 !empty(S.D) /< 判断 等 待 队列 是 否 为 空 */ 


wakeup(S.L): 。 /# 唤 醒 一 个 等 待 线程 / 


S.value=S.value-1; /# 可 用 资源 数 减 1*/ 


图 6-13 信号 量 P/V 操作 的 语义 


wait(S) 函 数 : 如 果 信 号 值 S.value 非 零 ，wait 就 将 S 减 1， 立 即 返 回 。 如 果 S.value 为 零 ， 就 将 
线程 在 等 待 队列 SL 中 挂 起 ， 直 到 一 个 V 操作 将 信号 值 加 1 后 重启 这 个 线程 。 线 程 重启 之 后 ，wait 
函数 将 S 减 1， 再 将 控制 返回 给 调用 者 。 

signal(S) 函 数 : 先 将 S.value 加 1， 如 果 队 列 SL 中 有 任何 挂 起 的 线程 ， 就 重启 其 中 一 个 ， 使 重 
启 的 线程 执行 Svalue 减 1 操作 ， 完 成 P 操 作 。 

函数 名 描述 前 级 primitive 说 明 wait 和 signal 是 原 语 函数 , 表示 它们 对 同一 信号 量 的 操作 是 互 斥 
的 ， 因 此 可 理解 成 wait 和 signal 函数 调用 是 完全 错开 执行 的 。 当 多 个 并 发 线程 (或) 进程 试图 同时 在 
同一 信号 量 上 执行 了 操作 或 V 操作 时 ， 只 有 一 个 线程 (或 进程 ) 获 准 进入 相应 的 原 语 函数 。 这 里 借用 
C++ 编程 语法 ，P/V 操作 采用 引用 参数 ， 表 示 对 实际 参数 的 引用 ， 函 数 中 的 操作 可 改变 实际 参数 值 。 

wait 和 signal 函数 的 定义 能 确保 一 个 正在 运行 的 程序 不 会 使 信号 量变 成 负 值 。 这 个 属性 称 为 信 
号 量 不 变性 (semaphore invarianb， 与 日 常生 活 中 计数 器 特性 一 致 ， 便 于 理解 。 


注意 : 

这 里 的 函数 wait、signal 是 操作 信号 量 加 1 与 减 1 的 原 语 函 数 ， 不 是 进程 控制 部 分 的 进程 等 待 、 
信号 处 理 程序 安装 函数 。 
哆 * 思 考 与 练习 题 6.10 什么 叫 原 语 ? 原 语 有 何 用 途 ? 
多 * 思 考 与 练习 题 6.11 某 个 信号 量 的 初 值 是 r， 执 行 m 次 P 了 操作 、n 次 V 操作 ， 其 值 变 成 
多 光 2 
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6.4.4 用 信号 量 及 P/V 操作 解决 资源 调度 问题 
1. 用 信号 量 与 P/V 操作 解决 临界 区 互 斥 执行 问题 


对 于 图 6-10 中 的 线程 互 扩 问题， 我 们 定义 一 个 互 斥 信号 量 mutex， 用 P/V 操作 来 解决 。 互 斥 信 
号 量 mutex 作为 临界 资源 的 锁 变 量 ， 代 表 资 源 使 用 权 ， 初 值 为 1， 表 示 初 始 为 开锁 状态 ， 使 用 权 可 
用 ， 相 关 等 待 队列 为 空 。 按 照 C 语言 规范 ，mutex 的 定义 应 写成 semaphore mutex={fl, NULL}, 但 为 
方便 阅读 ， 一 般 简 写成 semaphore mutex=1。 将 waittmutex) 作 为 临界 区 互 斥 执行 的 “进入 区 ”部 分 ， 
将 singalGnutex) 作 为 “退出 区 ”部 分 ， 代 码 框架 如 图 6-14 所 示 。 

当 多 个 线程 同时 试图 请 求 资源 时 ， 都 要 执行 “进入 区 ”的 代码 wait(mutex)， 由 于 P/V 操作 都 是 
原 语 过 程 ， 系 统 会 保证 它们 自动 错开 执行 。 

1; ”// 信 号 量 的 定义 ， 初 值 为 1， 表示 


线程 A( 或 进程 A): 线程 B( 或 进程 B): 
Thread AO{ Thread_ BO{ 


wait(mutex); 。 /* 获 得 临界 资源 */ wait(mutex); ” /获得 临界 资源 */ 


《< 临界 区 1(Critical section) >> 《< 临界 区 2(Critical section)>> 
signal(mutex); /站 归还 临界 资源 #/ signaltmutex); /# 归 还 临界 资源 #/ 
《< 剩余 代码 >> 《< 剩余 代码 ;>> 

} x 


图 6-14 用 信号 量 与 P/V 操作 解决 图 6-12 中 临界 区 互 斥 执行 问题 的 代码 框架 

先进 入 waitGmutex) 的 线程 (不 妨 假设 是 线程 A) 在 检测 条 件 “mutex.value 一 0” 时 , 由 于 mutex.value=1， 
条 件 为 false, 线程 执行 mutex.value 减 1 操作 ,使 其 变 成 0， 立即 返回 ,获得 临界 资源 ， 进 入 临界 区 。 

如 果 有 线程 被 唤醒 从 wakeup(mutex.L) 返 回 时 ，mutex.value=1， 该 线程 执行 mutex.L 减 1 操作 后 
返回 ， 立 即 获 得 临界 资源 而 进入 临界 区 。 每 次 最 多 唤醒 一 个 等 待 线程 让 其 进入 临界 区 ， 保 证 临界 资 
源 被 互 斥 操作 。 

后 进入 wait(mutex) 的 线程 (不 妨 假设 是 线程 B) 在 检测 条 件 mutex.value 一 0 时 , 结果 为 0, 线程 在 
等 待 队列 mutex.L 中 挂 起 。 如 果 还 有 更 多 进程 执行 wait(mutex) 竞 争 临 界 资源 ， 那 么 它们 都 会 因 检 测 
到 条 件 mutex.value=0 而 挂 起 。 

当 获 得 临界 资源 的 线程 从 临界 区 退出 时 ， 归 还 临界 资源 ， 执 行 singal(mutex) 操 作 时 ， 先 对 
mutex.value 做 加 1 操作 ， 使 其 变 成 1， 如 果 有 线程 等 待 ， 就 唤醒 该 线程 并 返回 ， 否 则 直接 返回 。 

如 果 有 线程 被 唤醒 从 wakeup(mutex.L) 返 回 时 ， 遇 到 语句 mutex.value=1, 该 线程 执行 mutex 工 减 
1 操作 后 返回 ， 立 即 获得 临界 资源 而 进入 临界 区 。 每 次 最 多 唤醒 一 个 等 待 线程 ， 让 其 进入 临界 区 ， 
保证 临界 资源 被 互 斥 操作 。 

信号 量 和 P/V 操作 满足 同步 机 制 设计 的 四 条 原则 : GD) 互 斥 ， 任 何 时 候 最 多 只 允许 一 个 线程 进入 
临界 区 ; (2) 有 限 等 待 ， 当 一 个 线程 在 等 待 队列 中 挂 起 时 ， 应 保证 在 有 限时 间 内 能 进入 其 临界 区 ; (3) 
空闲 请 进 ， 若 无 线程 在 临界 区 执行 ， 一 个 请 求 线程 立即 进入 其 临界 区 ; (4) 让 权 等 待 ， 临 界 资源 忙 时 ， 
请 求 线程 立即 挂 起 ， 释 放 处 理 器 ， 避 免 “ 循 环 测试 ”。 因 而 ， 信 号 量 同步 机 制 可 以 安全 、 公 平地 协 
调 并 发 线程 以 高 效 操作 临界 资源 ，CUP 利用 率 高 。 
如 = 思考 与 练习 题 6.12 设计 同步 机 制 的 四 条 原则 是 什么 ? 
绪 思考 与 练习 题 6.13 说 明 如 何 用 信号 量 和 P/V 操作 纠正 badcountc 中 的 代码 ， 实 现 对 共享 变量 
的 安全 访问 。 


彩 ” 思 考 与 练习 题 6.14 ”独木桥 问题 。 某 条 河上 只 有 一 座 独木桥 ， 每 次 只 能 承受 一 个 人 在 桥 上 走 。 
现在 河 的 两 边 都 有 人 要 过 桥 ， 按 照 下 面 的 规则 过 桥 。 为 了 保证 过 桥 安 全 ， 请 用 P/V 操作 写 出 安全 过 
桥 的 算法 描述 。 过 桥 的 规则 是 : 每 次 只 有 一 个 人 过 桥 。 


Process EWO 


过 桥 ; 
} 


2. 用 信号 量 和 P/V 操作 解决 资源 分 配 问题 


这 里 的 问题 描述 是 ， 某 类 资源 的 数量 为 N， 供 若干 个 进程 (或 线程 ) 共 享 使 用 ， 但 每 个 资源 只 能 
分 配给 一 个 进程 (或 线程 ) 互 斥 使 用 ， 要 求 不 发 生 多 进程 并 发 操作 同一 资源 的 情况 。 由 于 信号 量 是 一 
种 特殊 的 计数 器 ， 设 计 目的 就 是 解决 资源 分 配 问题 ， 而 P/V 操作 已 经 对 计数 值 0 的 异常 进行 了 捕获 
和 处 理 ， 因 此 用 信号 量 解决 资源 分 配 问 题 的 代码 非常 直观 简单 ， 只 需要 将 初 值 设置 为 某 种 资源 的 总 
数 ， 在 获取 资源 前 ， 执 行 P 操作 将 资源 数 减 1， 在 归还 资源 后 ， 执 行 V 操作 ， 将 资源 数 加 1 即 可 。 
因此 ， 用 信号 量 机 制 ， 协 调 多 个 线程 或 进程 ) 操 作 个 (N=1) 系 统 资源 的 代码 结构 如 图 6-15 所 示 。 


semaphore res=N: ”// 信 号 量 的 定义 ， 初 值 为 N 


线程 A( 或 进程 A): 线程 B( 或 进程 B): 
Thread_AO{ Thread_ BO{ 

wait(res); /* 资 源 数 减 1*/ wait(res); /* 资 源 数 减 1*/ 
《获取 一 个 资源 >> 《获取 一 个 资源 >> 

《使 用 资源 >> 《使 用 资源 >> 

《< 归还 一 个 资源 >> 《< 归还 一 个 资源 >> 
signal(res); 。。 /* 资 源 数 加 1#/ signal(res); 。 /* 资 源 数 加 1*/ 


图 6-15 用 信号 量 与 P/V 操作 协调 多 个 线程 互 斥 使 用 N 个 系统 资源 的 代码 框架 


在 这 里 ， 信 号 量 可 类 比 成 停车 场 的 出 入 口 车 闸 ， 汽 车 是 进程 (或 线程 )， 信 号 量 的 值 是 剩余 车 位 
数 ; 汽车 试图 通过 车 闻 取 卡 ， 就 是 执行 P 操作 ， 剩 余 车 位 数 减 1; 若 剩余 车 位 数 为 0， 则 汽车 必须 
在 外 等 待 ， 相 当 于 线程 挂 起 ， 若 有 车 位 ， 则 汽车 获得 车 位 ， 开 入 停车 ， 这 是 获取 资源 。 汽 车 驶 离 车 
位 就 是 归还 资源 ， 驶 出 车 闸 就 是 执行 V 操作 ， 将 剩余 车 位 数 加 1; 如 果 场 外 有 等 待 汽 车， 就 让 该 车 
驶 入 ， 是 唤醒 挂 起 的 线程 。P/V 操作 可 分 别 看 成 申请 资源 、 归 还 资源 。 

在 这 个 意义 上 ， 图 6-10 中 的 临界 资源 互 斥 使 用 问题 ， 可 看 成 资源 数 为 1 的 一 种 资源 分 配 问题 。 
因此 ， 图 6-15 和 图 6-14 中 代码 的 唯一 差异 只 是 信号 量 的 初 值 不 同 而 已 。 
好 = * 思 考 与 练习 题 6.15 停车 场 有 100 个 车 位 ， 请 用 P/V 操作 写 出 汽车 的 停车 、 出 车 描述 算法 。 
ge 思考 与 练习 题 6.16 有 一 个 阅览 室 ， 共 有 100 个 座位 ， 只 有 一 个 每 次 只 能 进出 一 个 人 的 出 入 口 。 
若 每 个 读者 的 活动 用 一 个 进程 表示 , 试用 信号 量 与 PAV 操作 协调 读者 进 阅览 室 、 读书、 出 阅览 室 的 活动 。 


3. 用 信号 量 和 P/V 操作 解决 同步 问题 


在 多 线程 并 发 环境 下 ， 除 临界 区 需要 互 斥 执行 外 ， 有 时 还 需要 对 并 发 线程 操作 的 执行 顺序 进行 
控制 ， 才 能 保证 运行 结果 的 正确 性 ， 这 就 是 线程 同步 问题 。 比 如 通过 共享 变量 传递 数据 ， 就 必须 保 
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证 按 写 操作 在 前 、 读 操作 在 后 的 顺序 执行 。 

(1) 单 向 同步 

第 一 种 情形 是 单 向 同步 ， 图 6-16(a) 是 问题 模型 ， 要 求 线程 Thread 1 的 操作 ActionA 在 线程 
Thread 2 的 操作 ActionB 开始 前 完成 。 

为 实现 二 者 同步 , 设想 ActionA 产生 了 某 种 虚拟 资源 (如 可 用 数据 ) 给 ActionB 获取 使 用 , 该 资源 
初始 时 并 不 存在 。 同 步 算 法 框架 如 图 6-16(b) 所 示 : 定义 一 个 初 值 为 0 的 同步 信号 量 sem 作为 资源 计 
数 器 , 在 产生 资源 的 ActionA 后 执行 signal(sem), 使 资源 数 加 1, 获取 资源 的 ActionB 前 调用 wait(sem)， 
使 资源 减 1。 


(a) 单 向 同步 问题 模型 @) 同步 算法 框架 
图 6-16 单 向 同步 问题 及 同步 算法 


在 图 6-16(b) 中 ， 由 于 sem 的 初 值 为 0，signal(sem) 操 作 必 定 在 wait(sem) 返 回 前 返回 ， 这 就 保证 
线程 Thread_1 的 操作 ActionA 一 定 会 在 线程 Thread 2 的 操作 ActionB 开始 前 结束 。 
思考 与 练习 题 6.17 假设 一 个 程序 由 四 个 操作 Tl1、T2、T3、T4 组 成 , 这 四 个 操作 必须 按 图 6-17 
所 示 的 前 趋 图 次 序 运行 ， 若 将 这 四 个 操作 分 别 安排 到 四 个 线程 中 执行 ， 用 信号 量 和 了 P/V 操作 表达 这 
四 个 线程 的 同步 关系 。 


(3) 


图 6-17 前 趋 图 


(2) 双向 同步 

stat.c 是 一 个 两 线程 合作 的 程序 示例 : 输入 线程 input_text 从 标准 输入 读 入 文本 串 存 入 缓冲 区 ， 
统计 线程 stat_text 计算 文本 串 中 字符 的 个 数 并 输出 显示 。 这 是 多 线程 因 未 同步 而 导致 错误 的 一 个 典 
型 示例 。 


入 statc 是 一 个 多 线程 因 未 同步 而 导致 错误 的 程序 示例 */ 


1 #include "wrapperh" 
2 #define SIZE 1024 

3 char buffer[SIZE]: 
4 
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5 void *input text(void *arg) /* 输入 线程 #/ 

6 { charst[SIZE]: 

7 while(1) { 

printft" 请 输入 文本 信息 ， 以 end 结束: \n"); 
9 scanfl"%%s",str); 

10 strcpy(bufferstD: 

11 这 stmcmp('end"str3) 一 0) break: 

12 } 

3 


14 ”void *stat_text(void *arg) ”人 * 统计 线程 *#/ 
15 { char st{SIZE]: 


16 while(1) { 

17 strepy(str,buffer); 

18 printf("You input %d characters\n" .strlen(str)): 
19 f(stmcmp("end", str,3)—0) break: 

20 } 

p1 Wn 

22 intmain0 { 


23 pthread t tidl, tid2; 

24 pthread_create(&tid1NULL, input_text NULL): 

25 pthread_create(&tid2. NULL., stat_ text NULL): 

26 pthread join(tidl .NULLD): 

27 pthread join(tid2.NULL): 

28 exit(EXIT_SUCCESS):; 

29 } 

由 于 统计 线程 一 旦 创建 就 运行 ， 因 此 无 论 用 户 是 否 输入 信息 ， 它 都 会 不 断 显示 缓冲 区 buffer 中 
的 字符 串 长 度 ， 从 而 导致 错误 ， 因 为 程序 中 没有 对 输入 线程 和 统计 线程 进行 同步 。 为 保证 程序 正确 
运行 ， 这 里 要 求 : 统计 线程 每 次 要 对 读 到 的 最 新 输入 信息 进行 字符 数 统计 ， 而 输入 线程 只 能 往 取 走 
数据 的 缓冲 区 存放 数据 。 

线程 间 通 过 缓冲 区 多 次 重复 传递 数据 的 场景 可 描述 成 图 6-18 所 示 的 模型 : 线程 A 产生 数据 ， 
将 数据 放 入 缓冲 区 (全 局 变量 )， 线 程 B 从 缓冲 区 读 出 数据 ， 进 行 处 理 。 

buffer 
图 6-18 ”线程 间 通过 缓冲 区 传递 数据 的 双向 同步 模型 
线程 A 要 将 数据 正确 传递 给 线程 B， 与 前 面 的 单 向 同步 不 同 ， 这 里 涉及 两 个 同步 ， 称 为 双向 同 


步 。 它 要 求 : 
e 线程 A 的 操作 buffer=v1 必须 在 线程 B 的 操作 v2=buffer 前 执行 ， 以 保证 线程 B 总 能 读 取 到 
新 的 数据 ; 
e 线程 A 的 第 二 次 操作 buffer=v1 必须 在 线程 B 的 第 一 次 v2=buffer 操作 之 后 ， 以 保证 不 覆盖 
buffer 中 尚未 取 走 的 数据 ; 
。 依 此 类 推 。 


这 是 一 个 典型 的 双向 同步 模型 。 在 这 个 示例 中 ， 可 以 认为 存在 两 种 虚拟 资源 : 空闲 单元 (无 数据 
的 单元 ) 和 数据 单元 ( 含 数据 的 单元 )。 执 行 操作 buffer=v1 前 要 获取 空闲 单元 ， 执 行 后 产生 数据 单元 ; 
执行 操作 v2=buffer 前 要 获取 数据 单元 ， 执 行 后 清空 缓冲 区 ， 产 生 空闲 单元 。 
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为 此 ， 定 义 两 个 信号 量 avail、ready 来 分 别 表示 空闲 单元 数 、 数 据 单元 数 ， 由 于 开始 时 缓冲 区 
为 空 ， 这 两 个 信号 量 的 初 值 分 别 为 1、0; 在 buf-vl 前 调用 wait(avail) 将 avail 减 1， 获 得 空闲 单元 ， 
之 后 调用 signal(ready) 将 数据 单元 数 加 1; 在 2=buf 前 调用 wait(ready) 将 数据 单元 数 减 1， 获 得 数据 
项 ， 之 后 调用 signal(avail) 将 空闲 单元 数 减 1。 图 6-19 中 展示 了 双向 同步 算法 描述 。 


semaphore avail=1, ready=0; 
Thread_10{ Thead 20{ 
while(D { while(1) { 
produce(v1): 话 产 生 数 据 #/ wait(ready): 
waittavail): V2=buf 上 取出 数据 */ 
buf=vl; /# 存 放 数据 到 buf 中 */ signal(avail); 
signaltready): process(v2); 。 ”/* 处 理 数据 */ 
} } 
} ， 


图 6-19 通过 缓冲 区 循环 传递 数据 的 双向 同步 算法 描述 
gb 思考 与 练习 题 6.18 一 个 盘子 只 能 放 一 个 水 果 , 父亲 每 次 洗 一 个 水 果 ( 革 果 或 橘子 ) 并 放 入 盘 中 ， 
儿子 专 吃 橘子 ， 女 儿 专 吃 革 果 ， 如 图 6-20 所 示 。 若 用 三 个 进程 表示 父亲 、 儿 子 、 女 儿 ， 请 用 P/V 操 
作 与 信号 量 实现 三 个 进程 间 的 同步 。 


6-20 示意 图 


6.4.5 用 Pthreads 同步 机 制 实现 线程 的 互 斥 与 同步 
1. Pthreads 同步 机 制 | 


前 面 介 绍 的 信号 量 (Semaphore) 是 一 种 抽象 的 同步 设施 ， 它 描述 了 信号 量 设施 应 具备 的 特征 及 功 
能 。 用 信号 量 构造 同步 算法 ， 便 于 阅读 和 理解 。 多 进程 (线程 ) 环 境 一 般 都 应 按照 规范 要 求 提 供 信号 
量 的 具体 实现 ， 才 能 编写 可 执行 的 同步 程序 。Linux 系统 支持 Pthreads 线程 规范 ，Pthreads 提供 四 
种 同步 设施 。 
e 信号 量 : 它 是 一 个 非 负 的 整数 计数 器 ， 数 据 类 型 定义 为 sm t， 被 用 来 控制 对 公共 资源 的 访 
问 和 现场 同步 ， 也 就 是 前 面 介绍 的 信号 量 在 Pthreads 线程 规范 中 的 实现 。 
e 互 斥 量 : 用 于 控制 多 个 线程 对 共享 变量 的 互 斥 访 问 ， 实 际 上 是 初 值 为 1 的 信号 量 ， 数 据 类 
型 定义 为 pthread mutex t。 
e 读 写 锁 : 与 互 斥 量 类 似 , 不 过 读 写 锁 允 许 更 细 的 并 行 性 , 互 斥 量 只 有 两 种 状态 加 锁 和 解锁 ) 。 
而 读 写 锁 有 三 种 状态 : 读 模 式 下 加 锁 、 写 模式 下 加 锁 、 无 锁 。 
e 条 件 变 量 : 通常 和 互 斥 量 一 起 使 用 ， 人 允许 线程 以 无 竞争 的 方式 等 待 特定 条 件 发 生 。 
Pthreads 规范 实现 的 信号 量 设施 是 Pthreads 信号 量 ， 类 型 为 sem t, 初始 化 及 对 应 的 P/V 操作 函 
数 分 别 为 sm _ init、sem_wait、sem post。 对 于 用 sem init 函数 初始 化 的 信号 量 ， 使 用 完毕 后 需要 用 
sem_destroy 函数 销毁 。 四 个 函数 的 声明 为 : 


##include<pthreadh> 
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int sem init(sem t *semint pshared.unsigned Value): 
返回 值 : 若 成 功 ， 创 建 并 初始 化 信号 量 ， 返 回 0， 信 号 量 地 址 保存 在 指针 变量 sem 中 ; 若 失败 ， 则 返回 
非 零 值 。 其 中 参数 pshared 的 值 一 般 为 0， 表示 在 多 线程 间 共 享 该 信号 量 。 
int sem wait(sem t *senm): 
int sem post(sem t *sem): 
int sem destroy(sem t *sem): 


返回 值 ; 成功 则 返回 0， 失 败 则 返回 -1。 


2. 用 Pthreads 信号 量 实现 进程 的 互 斥 


对 于 线程 的 互 斥 及 同步 算法 ， 只 需要 将 其 中 的 信号 量 和 P/V 操作 替换 成 Pthreads 信号 量 和 
sem_wait、sem_post 函数 调用 ， 按 C/C++ 语法 改写 程序 即 可 运行 : 

(1) 用 sem t mutex 蔡 换 信号 量 定 义 语句 semaphore mutex=1。 

(2) 在 主线 程 中 增加 信号 量 初始 化 语句 sem_init(mutex.0,1)。 

(3) 用 sem_wait(&mutex) 蔡 换 wait(mutex)。 

(4) 用 sem_post(&mutex) 替 换 signal(mutex)。 

(5) 在 程序 的 最 后 添加 destroy(&sem b 以 销毁 信号 量 ， 并 按 C/C++ 语法 规范 改写 代码 。 

在 实际 应 用 中 ， 在 保证 同步 及 互 斥 的 前 提 下 ， 应 尽 可 能 降低 程序 的 并 发 损失 ， 减 小 对 程序 性 能 
的 影响 。 为 此 ， 有 时 需要 对 程序 的 业务 流程 做 一 些微 小 改动 。 下 面 以 tickets.c 多 窗口 售票 应 用 为 例 
来 说 明 。 

简单 的 改写 方法 是 将 整个 含有 共享 变量 tickets 的 程序 段 用 P/V 操作 保护 起 来 ， 修 改 后 的 程序 为 
tickets2.c。 


店 tickets2.c， 用 Pthreads 信号 量 协调 ticketsl.c 中 多 线程 对 共享 变量 的 读 写 ， 编 译 命令 为 
gcc -0 tickets2 tickets2.c -lpthread 

1 #include "wrapper.h" 

int tickets =10; 

Void *counter(Void *); 

sem t mutex; 

int main(int argc, char **argv) 


pthread t tid[2]: 

int 卫 

sem_init(&mutex.0,1):; 证 将 信号 量 的 初 值 设置 为 1 */ 
10 forG=1:i<=-2:itH 

11 pthread_create(&tid[i]. NULL. counter, (void*)i): 


13 for(i=1 ;i<=2; it+) 

14 Pthread_join(tid[i], NULL): 
15 pthread_exit(0): 

16 sem _destroy(&mutex): 


18 void*counter(void *no) 


20 sem_wait(&mutex): 访 临界 区 加 锁 */ 
21 while(tickets>0) { 

22 printf" 柜 台 %d 卖 出 一 张 票 ， 票 号 为 %d\n", (inbno. tickets): 
23 usleep(1): 
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24 tickets 一 : 

25 usleep(1): 

26 } 

27 sem post(&mmutex); 庆 临界 区 解锁 */ 
2 

编译 执行 该 程序 : 

S$ /Mickets2 


柜台 1 卖 出 一 张 票 ， 票 号 为 10 
柜台 1 卖 出 一 张 票 ， 票 号 为 9 
柜台 1 卖 出 一 张 票 ， 票 号 为 8 
柜台 1 卖 出 一 张 票 ， 票 号 为 7 


尽管 结果 正确 ， 但 只 有 一 个 线程 执行 售票 ， 另 一 个 线程 被 完全 阻塞 ， 完 全 抢 不 到 票 ， 程 序 性 能 
大 大 降低 。 
改进 方案 1: 简单 地 将 sem_wait 语句 移 到 while 语句 后 ， 将 sem_post 语句 移 到 第 2 条 usleep 语 
名 前， 但 由 于 while 语句 中 的 共享 变量 tickets 未 纳入 保护 ， 可 能 导致 运行 结果 错误 。 比 如 当 ticket 
为 1 时 ， 恰 好 两 个 线程 紧 挨 着 执行 while(tickets>0) 条 件 检查 ， 结 果 都 是 tue， 不 存在 的 票 号 0 也 被 
售 出 ， 运 行 结果 错误 。 
Void *counter(void *no) 
{ 
while(tickets>0) { 
sem wait(&mutex): 
printf(" 柜 台 %d 卖 出 一 张 票 ， 票 号 为 "edm", (int)no, tickets): 
usleep(1) 
tickets 一 : 
sem_post(&mutex): 
usleep(1); 
} 


4 

改进 方案 2: 改写 counter 函数 ， 不 在 while 语句 中 引用 共享 变量 ， 改 为 在 while 循环 体 中 判断 
是 否 还 有 余 票 ， 为 提高 并 发 性 ， 将 没 必要 保护 的 第 2 条 usleep 语句 移动 解锁 语句 之 后 。 修 改 后 的 
counter 函数 如 下 : 


Void *counter(void *no) 
while(1) { 

sem_wait(&mutex): 

f(tickets>0) { 
printf(" 柜 台 %d 卖 出 一 张 票 ， 票 号 为 %dn", (int)no, tickets); 
usleep(1): 
tickets —; 

} 

sem_post(&mutex): 

Usleep(]): 
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不 难 获知 ， 通 过 使 用 互 斥 锁 实现 了 两 个 线程 对 共享 变量 的 互 斥 访问 。 即 便 将 线程 数 增加 到 四 个 
或 更 多 个 ， 结 果 也 是 正确 的 。 读 者 可 将 tickets2.c 程序 的 车 票数 改 为 100 或 更 大 的 数 ， 将 表示 售票 窗 
口 的 线程 数 也 增加 到 四 个 或 更 多 ， 进 行 验证 。 

然而 ， 改 进 方法 2 还 是 存在 缺陷 : counter 函数 的 语义 发 生 了 变化 ， 原 来 ticketsl.c 中 counter 函 
数 的 while 循环 在 余 票 为 0 时 结束 ， 但 这 里 修改 后 的 counter 函数 的 while 循环 却 是 死 循 环 。 如 何 修 
改 counter 函数 的 代码 ， 使 得 既 保 证 程序 正确 执行 ， 又 保持 原 有 语义 ， 请 读者 思考 。 

g 思考 与 练习 题 6.19 ”使 用 Pthreads 信号 量 改写 ticketsl.c， 在 保持 函数 语义 不 变 的 条 件 下 ， 
实现 对 共享 变量 的 互 斥 访问 。 
”思考 与 练习 题 6.20 ”使 用 Pthreads 信号 量 改写 代码 ， 消 除 badcount.c 中 存在 的 同步 错误 。 

Pthreads 规范 为 初 值 为 1 的 互 斥 信 号 量 专 门 设置 了 一 种 数据 类 型 一 - 互 斥 量 ， 数 据 类 型 为 
pthread_ mnutex_ t， 相 应 的 P/V 操作 函数 分 别 为 pthread_mutex_lock 与 pthread_mutex_unlock。 取 名 为 
互 斥 锁 显 得 直观 、 易 懂 、 易 用 。 

Pthreads 互 斥 锁 的 定义 和 初始 化 静态 方法 为 : 

pthread_ mutex t mutex=PTHREAD MUTEX INTTIALIZER: 

动态 创建 和 初始 化 互 斥 锁 为 开锁 状态 的 方法 是 : 

Pthread_mutex t *mutexp; 

pthread_mutex_init(mutexp, NULL); 

动态 方法 创建 的 互 斥 锁 需 要 用 pthread_mutex_destroy 销毁 。 

互 斥 锁 的 四 个 操作 函数 声明 如 下 : 

#include <semaphore.h> 

int pthread_mutex_init(pthread_mutex_t *mutexp,const pthread mutexattr t *mutexattr); 

int phread, mutex lock(pthread mtex t *rmtexp); 


int pthread_mutex_unlock(pthread_mutex_t *mutexp): 
int pthread_mutex_destroy(pthread_mutex_t *mutex): 


返回 值 :执行 成 功 返回 0， 失 败 返 回 非 零 值 。 


其 中 ，mutexp 是 指向 互 斥 锁 mutex 的 指针 ，mutexattr 是 初始 属性 指针 。 
多 * 思 考 与 练习 题 6.21 使 用 Pthreads 互 斥 锁 改 写 代 码 ， 消 除 badcount.c 中 存在 的 同步 错误 。 


3. 用 Pthreads 信号 量 编写 线程 同步 程序 


用 Pthreads 信号 量 编写 线程 同步 程序 ， 只 需要 将 用 信号 量 和 P/V 操作 描述 的 代码 更 换 成 用 
Pthreads 信号 量 及 相应 的 wait/signal 函数 描述 即 可 。 改 写 statc， 采 用 Pthreads 信号 量 编写 线程 同步 
代码 ， 下 面 为 改写 后 的 程序 statsync.c: 


请 statsync， 用 Pthreads 信号 量 实现 statc 中 多 线程 间 的 同步 */ 


1 #include "wrapper.h" 

2 #define SIZE 1024 

3 char buffer[SIZE]: 

4 sem t avail. ready: 证 空闲 单元 数 和 数据 单元 数 */ 
5 

6 void *input text(void *arg) 
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7 {char str[SIZE]: 

8 while(1) { 

9 printft" 请 输入 文本 信息 ， 输 入 end 为 程序 结束 : \n"); 
10 scanf("%%s".,str): 

11 sem_wait(&avail): 让 等 待 并 获取 空闲 单元 */ 
12 strepy(buffer.str): 

13 sem_post(&ready): 庆 产生 数据 单元 */ 
14 if(stmcmp("end",str,3)—0) break; 

15 | 

16 

17 Void *stat text(void *arg) 

18 { char st{SIZE]: 

19 while(1) { 

20 sem_wait(&ready); 庆 等 待 并 获取 数据 单元 */ 
2 strcpy(strbuffer): 

22 sem_post(&avail); 片 产生 空闲 单元 */ 
23 Pprintf("You input %d characters\n",strlen(str)); 

24 f(stmcmp("end", str,3)——0) break: 

25 } 

26 } 

27 int mainO| { 

28 pthread t tidl, tid2; 

29 Sem_init(&avail.0,1); 证 信号 量 初始 化 ， 初 始 空闲 单元 数 为 1 */ 
30 sem_init(&ready.0.0): 入 信号 灯 初 始 化 ， 初 始 数据 单元 数 为 0*/ 
31 pthread_create(&tidl,NULL, input_text NULL): 

32 pthread_create(&tid2. NULL., stat_text NULL): 

33 pthread_join(tidl.NULL); 

34 Pthread_join(tid2, NULL):; 

35 sem_destroy(&mutex): 

36 sem_destroy(&avail): 

gp sem_destroy(&ready): 

38 exit(EXIT_SUCCESS): 

39 } 

程序 执行 后 ， 得 到 如 下 正确 结果 : 

$ /statsyn 

请 输入 文本 信息 ， 输 入 end 为 程序 结束 : 

hello 

You input 5 characters 

请 输入 文本 信息 ， 输 入 end 为 程序 结束 : 

abcde 

You input 6 characters 

请 输入 文本 信息 ， 输 入 end 为 程序 结束 : 

end 


好 = 思考 与 练习 题 6.22 去掉 stat.c 中 的 所 有 sem wait 和 sem post 后 编译 执行 程序 ， 观 察 运行 
结果 ， 并 做 出 解释 。 

和 思考 与 练习 题 6.23 ” 桌 上 有 一 个 盘子 , 每 次 只 能 放 入 一 个 水 果 。 爸爸 专 放 革 果 ，, 妈妈 专 放 橘 子 ， 
儿子 专 等 吃 盘子 中 的 橘子 ， 女 儿 专 等 吃 盘 子 中 的 苹果 。 用 Pthreads 信号 量 实现 爸爸、 妈妈 、 儿 子 、 
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女儿 间 线程 的 同步 ， 编 写 可 运行 的 真实 程序 ， 用 Printf 输出 动作 名 称 来 表示 动作 。 
6.4.6 ”共享 变量 的 类 型 与 同步 编程 小 结 


62 节 介绍 了 共享 变量 的 识别 方法 ，6.3 节 介绍 了 由 共享 变量 并 发 访问 引起 的 同步 错误 ， 给 出 了 
使 用 信号 量 和 P/V 操作 进行 线程 互 斥 与 同步 编程 的 方法 。 这 里 系统 地 总 结 变量 共享 的 各 种 情形 ， 分 
辩 同 步 及 互 斥 类 型 。 一 般 有 四 种 情况 。 


1. 读 写 操作 不 并 发 


通常 ， 是 否 需 要 对 共享 变量 操作 进行 干预 的 判断 依据 ， 是 看 访问 操作 是 否 会 导致 程序 的 执行 结 
果 不 一 致 。 如 果 两 个 线程 对 共享 变量 的 操作 访问 是 非 并 发 的 ， 即 完全 错开 执行 ， 则 各 线程 对 共享 变 
量 的 并 发 访问 不 会 影响 程序 执行 结果 的 正确 性 。 因 此 ， 不 需要 进行 任何 干预 。 例 如 在 pthread3.c 中 ， 
线程 也 在 线程 tl 后 执行 ， 线程 也 读 STU 结构 体 变量 的 操作 全 部 在 线程 tl 写 STU 的 操作 后 。 这 种 
情况 不 难 理解 。 


2. 读 与 读 并 发 


如 果 各 并 发 线程 对 共享 变量 的 访问 操作 都 是 读 操作 ， 那 么 这 类 变量 的 存在 不 会 影响 到 程序 执行 
结果 的 正确 性 ， 不 需要 对 并 发 读 操作 进行 干预 。 例 如 ，sharvarc 的 main 线程 定义 了 局 部 数组 变量 
messages， 该 变量 通过 全 局 指针 pointer 共享 给 对 等 线程 tl 和 也 , 但 tl 和 也 都 仅 对 数组 执行 读 操 作 ， 
不 会 影响 程序 执行 结果 的 正确 性 。 


3. 读 / 写 与 读 / 写 并 发 


如 果 各 线程 都 对 共享 变量 执行 读 写 操作 ， 先 读 后 写 ， 根 据 变量 的 旧 值 计算 新 值 ， 然 后 写 回 ， 这 
种 情况 一 般 要 求 每 个 线程 访问 共享 变量 的 操作 互 斥 执 行 ， 才 能 获得 正确 的 执行 结果 ， 因 此 属于 线程 
互 斥 。ticketsl.c 和 badcount.c 都 属于 这 种 情况 ， 用 互 斥 信号 量 和 P/V 操作 进行 协调 。 


4. 读 与 写 并 发 


如 果 两 个 并 发 线程 中 ， 一 个 线程 写 共享 变量 ， 另 一 个 线程 读 共 享 变 量 ， 一 般 要 求 读 线程 每 次 能 
读 到 变量 的 新 值 ， 这 就 需要 在 读 线程 和 写 线程 间 同 步 。stat.c 属于 这 种 情况 ， 可 通过 同步 信号 量 和 
P/V 操作 进行 协调 。 

因此 , 在 多 线程 (或 多 逻辑 流 ) 并 发 访问 共享 变量 的 应 用 中 , 仅 在 有 线程 (或 逻辑 流 ) 对 共享 变量 存 
在 并 发 读 写 操作 的 情形 下 ， 才 需要 在 线程 (或 逻辑 流 ) 间 进行 同步 干预。 
旨 思考 与 练习 题 6.24 ”阅读 pthread2.c 的 源 代码 ,为何 存在 多 个 线程 对 全 局 变量 x、r1、12 的 并 发 
访问 ， 却 不 需要 对 程序 进行 同步 干预 ? 


[| 经 典 同步 问题 


前 一 节 主要 讨论 两 个 线程 或 进程 间 的 同步 , 实际 应 用 中 多 个 进程 间 的 同步 问题 也 是 普遍 存在 的 。 
其 中 有 几 种 典型 的 同步 问题 ， 各 代表 一 类 应 用 。 本 节 讨 论 生产 者 /消费 者 和 读者 / 写 者 两 种 典型 同步 


242 


第 6 章 ”线程 控制 与 同步 互 斥 


问题 的 编程 规律 和 方法 。 


S51 


生产 者 /消费 者 问题 


问题 描述 : 一 些 生产 者 线程 (或 进程 ) 不 断 地 生产 产品 (数据 资料 ， 提 供给 另 一 些 消费 者 线程 (或 
进程 ) 去 消费 , 在 它们 之 间 设 置 有 包含 N 个 单元 的 缓冲 区 buffN], 生产 者 线程 可 将 它 所 生产 的 产品 ( 数 
据 资料 ) 放 入 一 个 单元 中 ， 消 费 者 进程 可 从 一 个 单元 取得 一 个 产品 (数据 资料 ) 来 消费 。 所 有 的 生产 者 
线程 和 消费 者 线程 以 异步 方式 并 发 运行 ， 它 们 之 间 必 须 保 持 同 步 ， 即 不 允许 消费 者 线程 到 一 个 空 的 
单元 去 取 产 品 , 也 不 允许 生产 者 线程 向 一 个 已 存 有 消息 但 尚未 被 取 走 数据 资料 的 单元 投放 数据 资料 ， 


如 图 6-21 所 示 。 


生产 者 
生产 者 2 


生产 者 k”“ 存 


0 1 2 3 和 Ee N-1 消费 者 1 
消费 者 2 
N 个 大 小 相等 的 缓冲 区 ,每 。 取信 消费 者 m 


个 缓冲 区 可 存放 一 条 消息 


6-21 生产 者 /消费 者 问题 描述 


我 们 先 写 出 这 两 类 线程 的 代码 及 描述 ， 黑 体 部 分 是 需要 同步 的 代码 : 


int buffN]; 
int outpos=0; 
int inpos=0; 


void Thread_Pi0 
{ 
while (D{ 
item=produceO: 
sbuf insertlitem,bug; 
} 
b 


void Thread_Ci0 
{ 
while (D{ 
item=sbuf remove(buf); 
consume(item): 
} 
} 


void sbuf insert(item, buf) 

{ 
buffinpos]-item: 
inpos=(inpos+1)mod N; 


int sbuf remove(buf) 


上 # 数据 缓冲 区 ， 有 尺 个 单元 */ 
上 # 数据 读 出 位 置 */ 
上 # 数据 写 入 位 置 */ 


上 # 生产 者 线程 ， 有 k 个 */ 


庆 产生 数据 */ 
上 # 向 缓冲 区 投放 数据 */ 


上 # 消费 者 线程 ， 有 mm 个 */ 


让 从 缓冲 区 取 走 数据 */ 


户 消费 或 处 理 数 据 */ 


庆 数据 写 入 函数 */ 


让 数据 读 出 函数 */ 
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不 难 判断 ， 该 问题 符合 图 6-18 的 双向 同步 问题 模型 ， 可 套用 图 6-19 中 的 同步 算法 代码 ， 由 于 
本 例 的 缓冲 区 有 N 个 单元 ， 图 6-19 中 信号 量 avail 的 初 值 应 设置 为 N。 另 外 ， 两 类 线程 要 通过 共享 
指针 变量 inpos、outpos 并 发 操作 共享 缓冲 区 buf。 共 享 变量 inpos、outpos 可 看 成 一 种 临界 资源 ， 
sbuf insert 和 sbuf remove 是 临界 区 ， 设 置 一 个 互 斥 信号 量 mutex 来 对 其 进行 加 锁 保护 。 按 C 语言 
语法 完善 变量 定义 并 增加 同步 机 制 后 的 生产 者 /消费 者 描述 算法 如 下 所 示 ， 其 中 ， 函 数 sbuf insert 和 
sbuf remove 的 定义 保持 不 变 。 创 建生 产 者 和 消费 者 线程 的 主线 程 代码 请 读者 自行 给 出 。 
#define N 20 
semaphore avail=N, ready=0; 
semaphore mutex =1; 
int buffN]: 上 # 数据 交换 缓冲 区 ， 有 NN 个 单元 */ 
int inpos=outpos=0; 上 # 缓冲 区 队列 访问 指针 */ 


void Thread_Pi0 上 # 生产 者 线程 有 kk 个 *#/ 

int item:; 

while (1){ 
item=produce(): 上 # 产生 数据 ， 其 功能 由 编程 者 自行 定义 和 实现 */ 
wait(avaiD; 
wait(mutex); 
sbuf insert(item.buf); 上 # 向 缓冲 区 存放 数据 */ 
signal(mutex); 
signal(ready); 


} 


void Thread_Ci0 庆 消费 者 线程 ， 有 了 m 个 */ 
int item: 
while (D{ 
wait(ready); 
wait(mutex); 
item=sbuf remove(buf): 上 # 从 缓冲 区 取 走 数据 */ 
signal(mutex); 
signal(avail); 
consume(item): 上 # 消费 或 处 理 数据 ， 该 函数 的 功能 也 */ 
} 庆 由 编程 者 自行 定义 和 实现 */ 
} 


好 = 思考 与 练习 题 6.25 分 析 上 一 页 中 的 代码 描述 ,说明 变 量 inpos、outpos 和 数组 buf 及 其 元 素 是 
否 是 共享 变量 ， 如 果 是 ， 分 别 被 哪些 线程 共享 ? 然后 根据 分 析 结 果 优化 程序 代码 ， 提 高 其 并 发 性 。 

有 ”思考 与 练习 题 6.26 ”在 上 面 的 同步 算法 中 ， 假 设 p 表示 生产 者 数量 ，c 表示 消费 者 数量 ,，n 表 
示 以 数据 单元 为 单位 的 缓冲 区 大 小 。 对 于 下 面 每 个 场景 ， 指 出 生产 者 和 消费 者 函数 中 的 互 斥 锁 信号 
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量 是 否 是 必需 的 ， 为 什么 ? 

A. p=1, c=1,n>1 B. p=1, c=1, m1 

C.p>1,c>1, ol D. p>l, c=1,n>1 
喝 ”思考 与 练习 题 6.27 桌 上 有 一 个 盘子 ， 最 多 可 放下 两 个 水 果 ， 每 次 只 能 放 入 或 取出 一 个 水 果 。 
爸爸 专门 向 盘子 中 放 苹 果 (apple), 妈妈 专门 向 盘子 中 放 桶 子 (orange), 两 个 儿子 专 等 吃 盘 子 中 的 橘子， 
两 个 女儿 专 等 吃 盘 子 中 的 革 果 。 请 用 P/V 操作 实现 爸爸 、 妈 妈 、 儿 子 、 女 儿 之 间 的 同步 与 互 斥 关系 。 


6.5.2 ”读者 / 写 者 问题 


问题 描述 : 有 两 组 并 发 线程 一 读者 和 写 者 ， 它 们 共享 一 组 数据 区 ， 需 要 用 信号 量 与 P/V 操作 
解决 这 些 线程 同步 问题 。 要 求 : 1) 允许 多 个 读者 同时 执行 读 操作 ; 2) 不 允许 读者 、 写 者 同时 操作 ; 
3) 不 允许 多 个 写 者 同时 操作 ， 如 图 6-22 所 示 。 


写 者 1 写 者 2 写 者 n 


be 
外 外 从 


读者 1 ”读者 2 读者 n 
图 6-22 读者 / 写 者 问题 模型 


基本 设计 思路 是 : 
e 将 数据 区 看 成 一 种 共享 变量 或 临界 资源 ， 各 个 写 者 与 整个 读者 集体 竞争 共享 资源 的 使 用 权 ， 
因此 可 设置 一 个 初 值 为 1 的 互 斥 信号 量 wmutex 来 表示 共享 数据 区 的 使 用 权 。 
ee 写 者 操作 为 临界 区 ， 在 前 后 分 别 添加 wait(wmutex) 和 signal(wmutex)。 
e 第 一 个 读者 去 竞争 共享 数据 区 的 使 用 权 , 执行 wait(wmutex), 最 后 一 个 读者 归还 共享 数据 区 
的 使 用 权 ， 执 行 signal(wmutex)。 
为 此 ， 需 要 一 个 变量 count 来 记录 读者 数 ， 所 有 读者 线程 对 共享 变量 count 做 并 发 读 写 操作 ,为 
保证 coun 中 计数 值 正 确 ， 还 需要 设置 一 个 互 斥 信号 量 mutex， 用 于 对 变量 count 的 读 写 操作 加 锁 。 
读者 / 写 者 问题 的 同步 描述 代码 如 下 : 


Semaphore mutex=1, wmutex=1; 
int count=0; 
writer iO 颇 写 者 线程 i */ 


reader i0 片 读者 线程 1 */ 
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wait(mutex); 

counttt; 

(count—1) 庆 第 一 个 读者 所 
Wwait(wmutex); 

singal(mutex); 

<< 读 操作 >> 
Wwait(mutex); 

Count—; 

下 (count 一 0) 庆 最 后 一 个 读者 */ 
singal(wmutex); 

signal(mutex); 


} 
gp * 思 考 与 练习 题 6.28 一 名 主 修 动物 行为 学 、 辅 修 计算 机 科学 的 学 生 参 加 了 一 个 课题 ， 调 查 花 
果 山 的 猴子 是 否 能 被 教会 理解 死 锁 。 他 找到 一 处 峡谷 ， 横 跨 峡 谷 拉 了 一 根 绳索 (假设 为 南北 方向 )， 
这 样 猴子 就 可 以 攀 着 绳索 越过 峡谷 。 只 要 它们 朝 着 相同 的 方向 ， 同 一 时 刻 可 以 有 多 只 猴子 通过 。 但 
是 如 果 在 相反 的 方向 同时 有 猴子 通过 ， 则 会 发 生死 锁 (这 些 猴 子 将 被 卡 在 绳索 中 间 ， 假设 这 些 猴子 无 
法 在 绳索 上 从 另 一 只 猴子 身上 翻 过 去 )。 如 果 一 只 猴子 想 越过 峡谷 ， 它 必须 看 清 当 前 是 否 有 别 的 猴子 
在 逆向 通过 。 请 使 用 信号 量 和 P/V 操作 来 解决 该 问题 。 


同 


*6.6.1 AND 型 信号 量 


在 前 面 图 6-23 下 方 示例 代码 的 同步 算法 中 ， 如 果 我 们 不 小 心 将 消费 者 线程 (或 进程 )Ci 中 的 两 个 了 
操作 的 顺序 写 反 ， 如 下 所 示 : 


Thread Pi0 Thread Ci0 

3 人 
Al:wait(avaiD; B;: wait(mutex); 
Bi: wait(mutex); A:: wait(ready); 


在 信号 量 ready 和 mutex 的 信号 值 分 别 为 0 和 1 时 ， 若 两 个 线程 (或 进程 ) 的 推进 顺序 恰好 为 
BzA1AzB1， 线 程 Pi 和 Ci 分 别 执行 完 Ai、Bz 后 ， 信 号 量 mutex、ready 的 值 都 是 0， 两 个 线程 继续 往 
下 执行 B1、A2 时 ， 都 将 被 挂 起 而 导致 死 锁 。 
产生 上 述 问题 的 原因 是 ， 线 程 (或 进程 ) 在 获得 一 个 资源 后 ， 而 在 此 期 间 ， 资 源 却 被 其 他 线程 (或 
进程 ) 取 走 ， 又 去 申请 另 一 个 资源 。 AND 型 信号 量 允许 我 们 在 一 次 P 原 语 操作 中 同时 获取 多 个 资源 ， 
以 避免 发 生 上 述 异 常 ， 其 P/V 操作 定义 为 : 
Primitive swait(S1, S2..…. Sn) 。 人 *P 操 作 *#/ 
‘ 
while (Sl1.value—0 or S2.value—0 or ... or Sn.value—0 ) 
<< 在 某 个 信号 值 为 0 的 信号 量 Si 上 阻塞 >>: 
forG=1:i<=n: it+) 
Sivalue=Sivalue-1; 
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primitive ssignal(S1, S2..…, Sn) ” 语 V 操 作 */ 


1 
for(i=1; i<=n; i++) 
S.value=S.valuetl1; 
<< 如 果 某 个 信号 量 Si 的 等 待 队列 中 有 进程 挂 起 ， 就 唤醒 其 中 一 个 挂 起 的 进程 >> 
} 


采用 AND 型 信号 量 ， 将 之 前 同步 代码 中 的 生产 者 和 消费 者 代码 改写 成 如 下 形式 ， 这 不 但 消除 
了 因 P/V 操作 执行 顺序 不 当 引 起 的 死 锁 问题 ， 代 码 也 更 加 简洁 。 


Thread PiO 旋 生产 者 线程 */ 
{ 
while (ue){ 
item=produce(); 翌 产生 数据 #1 
swait(avail,mutex); 
sbuf insert(iten.buf); 庆 向 缓冲 区 中 存放 数据 */ 
ssignal(mutex,ready); 
} 
} 
Thread_Ci0 庆 消费 者 线程 */ 
while (tue){ 
swait(ready,mutex); 
item=sbuf romove(buf): 上 # 从 缓冲 区 取 走 数据 */ 
ssignal(mutex,avail); 
consume(item): 上 # 消费 或 处 理 数据 */ 
} 
} 


*6.6.2 ”信和 号 量 集 

并 发 线程 (进程 ) 有 时 需要 n 个 某 类 临界 资源 ， 如 果 通 过 mn 次 wait 操作 申请 n 个 临界 资源 ， 操 作 
效率 很 低 ， 并 可 能 出 现 死 锁 。 信 和 号 量 集 就 是 针对 这 种 情况 设计 的 ， 它 在 AND 型 信号 量 的 基础 上 扩 
展 而 成 ,允许 在 一 次 原 语 操作 中 完成 对 所 有 资源 的 申请 。 线程 对 信号 量 Si 的 测试 值 为 t( 表 示 信 号 量 
的 判断 条 件 ， 要 求 Si>ti， 即 当 资 源 数量 不 高 于 tt 时， 便 不 予 分 配 )， 占 用 值 为 di( 表 示 资 源 的 申请 量 ， 
即 Si=Si - d)， 对 应 的 P/V 原 语 格式 为 : 


Primitive swait(S1.t1. dl: .Sn.tn,dn)  /# 了 操作 所 
{ 
while (Sl1.value<t] or S2.value<t2 or ... or Sn value<tm ) 
<< 在 某 个 信号 值 低 于 的 信号 量 Si 上 阻塞 >>: 


for(i=1: i<=n; itt) 


Sivalue=Sivalue-di: 
} 
primitive ssignal(S1. dl: ...: Sn. dn) 上 # 立 操作 所 
{ 
for(=1: i<=n: itH) 
S.value=S.valuetdi: 
<< 如 果 某 个 信号 量 Si 的 等 待 队列 中 有 进程 挂 起 ， 就 唤醒 其 中 一 个 挂 起 的 进程 >> 
} 
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Linux IPC 机 制 中 的 IPC 信号 量 就 是 信号 量 集 的 一 种 实现 ， 本 书 将 在 第 7 章 中 进行 介绍 。 
*6.6.3 条件 变 量 


条 件 变量 是 利用 线程 间 共 享 变量 进行 同步 的 一 种 机 制 ， 允 许 线程 在 操作 共享 变量 期 间 挂 起 ， 直 
到 共享 数据 上 的 某 些 条 件 得 到 满足 。 条 件 变量 上 有 两 个 基本 操作 : 一 个 线程 因 “ 条 件 成 立 ” 而 挂 起 ; 
另 一 个 线程 给 出 条 件 成 立信 号 。 为 了 避免 竞争 ， 条 件 的 检测 与 触发 通过 一 个 互 斥 量 来 保护 。 与 使 用 
同步 信号 量 相 比 ， 显 得 更 加 直观 、 通 用 、 灵 活 ， 能 解决 一 些 光 靠 信号 量 不 能 解决 的 问题 。Pthreads 
规范 实现 了 较 完整 的 条 件 变 量 功能 ， 条 件 变 量 的 初始 化 有 静态 和 动态 两 种 方法 。 静 态 方法 定义 和 初 
始 化 如 下 : 

pthread_cond tcond =PTHREAD COND_INITIALIZER: 

动态 方法 初始 化 通过 执行 以 下 函数 调用 来 实现 : 

pthread_cond tscond: 

pthread_cond init(cond, NULL): 

条 件 变量 机 制 下 的 主要 函数 声明 如 下 : 

#include <pthreadh> 

int pthread_cond_init(pthread_cond._t *cond, pthread_condattr tscond_attpj: 


int pthread_cond_signal(pthread_cond_t *cond): 
int pthread_cond_broadcast(pthread_cond + *cond); 


int pthread_cond_wait(pthread_cond + *cond, pthread_mutex_t *mutex): 
int pthread_cond_timedwait(pthread_cond + *cond, pthread_mutex_t *mutex, 
const struct timespec *abstime): 
int pthread_cond_destroy(pthread_cond + *cond); 
返回 值 ， 在 执行 成 功 时 ， 所 有 条 件 变 量 函数 都 返回 0， 执 行 失败 时 返回 非 零 的 错误 代码 。 


pthread cond init 使 用 cond attr 指定 的 属性 初始 化 条 件 变 量 cond， 通 常 cond attr 为 null。 
pthread_cond signal 唤醒 在 条 件 变 量 上 等 待 的 一 个 线程 ， 若 无 等 待 线 程 ， 则 无 操作 ; 
pthread_cond_broadcast 唤醒 等 待 该 条 件 变量 的 所 有 线程 。pthread_cond_wait 解锁 互 斥 量 (如 同 执行 了 
pthread_unlock_mutex)， 并 挂 起 调用 线程 ， 等 待 条 件 变量 触发 。 在 调用 pthread_cond_wait 之 前 ， 应 
用 程序 必须 加 锁 互 斥 量 。 在 该 函数 返回 前 ， 自 动 重新 加 锁 互 斥 量 ( 如 同 执行 了 pthread_ lock_mutex)。 
pthread cond timedwait 限定 等 待 时 间 , 如 果 在 等 到 绝对 时 间 abstime 后 , 即使 cond 未 触发 , 也 返回 。 
pthread cond destroy 销毁 一 个 条 件 变量 ， 释 放 它 拥有 的 资源 。 

前 面 的 生产 者 /消费 者 同步 问题 用 条 件 变量 实现 的 代码 如 下 : 


#define N 20 

typedef struct { 
int *buf: 庆 循环 缓冲 区 队列 数组 */ 
intn: 片 缓冲 区 队列 容量 */ 
int outpos: 庆 读 出 指针 */ 
intinpos: 上 话 写 入 指针 *#/ 
pthread mutex t lock: 上 # 用 于 访问 缓冲 区 队列 的 互 斥 锁 */ 
pthread cond t avail cond: 此 缓冲 区 队列 有 空闲 单元 的 条 件 */ 
pthread cond t ready cond: /* 缓冲 区 队列 有 可 用 数据 的 条 件 */ 
int count 庆 缓冲 区 中 可 用 数据 单元 数 */ 

} sbuft 
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void sbuf init(sbuf t *sp. int n) 


{ 


} 


sp->buf= Calloc(n, sizeof(int)); 


sp>n=n: 片 设置 缓冲 区 大 小 */ 
sp->outpos= sp->inpos =0; 片 将 读 出 指针 和 写 入 指针 初始 化 为 0*/ 
pthread_mutex_init(&sp->lock, NULL); 请 初始 化 互 斥 信号 量 为 1 */ 


pthread cond_init (&sp->avail cond NULL): 上 # 初始 化 条 件 变量 */ 
pthread_cond init (&sp->ready_condNULL): 上 # 初始 化 条 件 变 量 */ 
sp->count=0; 上 # 初始 化 可 用 数据 单元 数 */ 


店 清理 缓冲 区 sp */ 
Void sbuf deinit(sbuf t *sp) 


{ 


} 


pthread cond destroy(&sp->lock): 
pthread cond destroy(&sp->avail cond): 
Pthread_mutex_destroy(&sp->ready_cond): 
free(sp->buf); 


上 # 向 共享 缓冲 区 sp 后 插入 数据 item */ 
void sbuf insert(sbuf t *sp, int item) 


{ 


} 


pthread mutex_lock(&sp->lock): 
让 (sp->count 一 sp->D) 证 缓冲 区 队列 无 空闲 单元 */ 
pthread cond_ wait(&sp->avail cond,é&sp->lock); 


sp->buf[sp->inpos 上 Fitem # 向 缓冲 区 存放 数据 */ 
sp->inpos=(sp->inpos+1) % sp->n: 


让 (sp->countt+ 一 0) 让 缓冲 区 队列 中 无 可 用 数据 */ 
pthread_cond sigal(&sp->ready cond); 
pthread mutex_Unlock(&sp->lock): 


证 移 除 和 返回 共享 缓冲 区 队列 sp 中 的 第 一 个 数据 项 */ 
int sbuf remove(sbuf t *sp) 


{ 


pthread_mutex_lock(&sp->lock); 
让 (sp->count 一 0) 上 # 缓冲 区 队列 无 可 用 数据 */ 
pthread cond wait(&sp->ready cond,é&sp->lock); 


item=sp->buf[sp->outpos]: 诊 从 缓冲 区 读 出 数据 */ 
sp->outpos=(sp->outpos+1)% sp->n; 
if(sp->count——sp->n) 上 庆 缓冲 区 队列 无 空 单元 *#/ 


pthread cond sigal(&sp>ready cond); 
Pthread_mutex_unlock(&sp->lock); 
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void Thread Pi(sbuf t+sp) 上 # 生产 者 线程 ，sp 是 缓冲 区 指针 */ 
{ intitem:; 
while (rue){ 
item=produce0: 诊 产生 数据 */ 
sbuf insert(item.sp); 上 # 向 缓冲 区 写 入 数据 */ 
} 
} 
void Thread_Ci(sbuf t *sp) 让 消费 者 线程 */ 
{int item; 
while (D){ 
item=sbuf remove(sp): # 从 缓冲 区 取 走 数据 */ 
consume(item): 记 消费 或 处 理 数据 */ 
} 
} 


*6.6.4” 管 程 

管 程 的 概念 是 由 Hoare 和 Hanson 于 1973 年 提出 的 ， 他 们 定义 了 一 个 数据 结构 以 及 能 为 并 发 线 
程 (进程 ) 在 该 数据 结构 上 执行 的 一 组 操作 ， 这 组 操作 能 同步 线程 (进程 ) 和 改变 管 程 中 的 数据 。 管 程 主 
要 由 以 下 三 部 分 组 成 : 1) 受 限于 管 程 的 共享 变量 声明 ; 2) 对 该 数据 结构 进行 操作 的 一 组 过 程 ; 3) 对 受 
限于 管 程 的 数据 设置 初始 值 的 语句 ， 如 图 6-23 所 示 。 


共享 数据 


-级 操作 过 程 


初始 化 代码 


图 6-23 管 程 的 结构 


管 程 机 制 的 一 个 好 处 是 ， 管 程 结构 本 身 能 保证 临界 区 代码 的 互 斥 执行 ， 免 去 在 程序 中 给 临界 区 
代码 加 锁 、 解 锁 的 麻烦 ， 管 程 还 可 利用 条 件 变量 ， 实 现 线程 间 同 步 。 管 程 机 制 在 Java 语言 中 得 到 很 
好 的 支持 。 

用 Java 语言 解决 生产 者 /消费 者 问题 的 代码 如 下 : 


class sbuf tf 

private int [] buf=new int [20] ; 请 循环 缓冲 区 队列 数组 */ 

private intoutps: 话 读 出 指针 */ 

Private intinpos: 上 # 写 入 指针 所 
private int count: 上 # 缓冲 区 队列 中 可 用 资源 的 数量 */ 
public synchronized voidsbuf insert(int item) 
{ 

ty{ 


while (count 一 buflength) 
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this.waitO; 
buffinposFitem: 
inpos =(inpos+1)% N: 
if(count—0) 
this.notifyO; 
count = count+]; 
} catch (Exception e) 
eprintStackTrace0: 
} 
public synchronized intsbuf remove0 
. 
ty{ 
while (count—0) 
this.waitO; 
int item=buffoutpos]; 
outpos=(outpos+1) %N; 
让 (count 一 buflengtb) 
this.notify0; 
count 一 : 
Tetum item 
} catch (Exception e) 
e.printStack TraceO; 


多 线程 并 发 的 其 他 问题 


从 上 述 示 例 中 可 以 看 到 , 多 线程 程序 中 一 旦 要 求 同 步 对 共享 数据 的 访问 , 事情 就 变 得 复杂 多 了 。 
迄今 为 止 ， 我们 已 经 看 到 了 用 于 线程 互 斥 和 同步 的 编程 技术 ， 但 这 仅仅 是 冰山 一 角 ， 还 有 很 多 需要 
依靠 其 他 方法 来 处 理 的 问题 。 本 节 继 续 介 绍 编写 并 发 程序 时 遇 到 的 其 他 问题 及 解决 方法 。 为 便于 理 
解 ， 仍 然 基于 示例 程序 进行 讨论 。 需 要 注意 的 是 ， 这 些 问 题 是 任何 类 型 的 并 发 流 操作 在 共享 资源 时 
都 会 出 现 的 。 


*6.7.1 线程 安全 


与 传统 上 编写 顺序 程序 不 同 ， 在 多 线程 应 用 程序 中 ， 我 们 很 多 情况 下 只 能 调用 具有 线程 安全 性 
(thread safety) 属 性 的 函数 。 一 个 函数 被 称 为 线程 安全 的 (thread-safe)， 是 指 它 在 被 多 个 并 发 线程 反复 
调用 时 ， 都 能 产生 正确 的 结果 。 如 果 一 个 函数 被 并 发 线程 调用 且 可 能 导致 错误 结果 ， 我 们 就 说 它 是 
线程 不 安全 的 (thread unsafe)。 我 们 能 够 定义 出 四 种 线程 不 安全 的 函数 。 

第 1 类 : 不 保护 共享 变量 的 函数 。 我 们 在 示例 程序 badcout'c 的 increase 和 decrease 函数 中 就 已 
经 遇 到 过 这 样 的 问题 ， 这 两 个 函数 分 别 对 一 个 未 受 保护 的 全 局 计数 器 变量 cnt 做 加 1 操作 。 改 写 程 
序 ， 用 Pthreads 信号 量 来 约束 访问 共享 变量 的 代码 ， 可 将 这 类 线程 函数 转换 成 线程 安全 函数 , 而 且 
调用 程序 不 需要 做 任何 修改 。 

第 2 类 : 保持 跨越 多 个 调用 的 状态 的 函数 。 下 面 的 伪 随 机 数 生成 器 random 是 一 个 示例 程序 。 
该 示例 程序 定义 了 一 个 静态 局 部 变量 next 来 保存 前 一 次 调用 的 中 间 结 果 ， 当 前 返回 值 依 赖 于 中 间 结 
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果 。 当 调用 srand 函数 为 random 设置 种 子 next 后 ， 从 一 个 单线 程 程 序 中 反复 地 调用 random， 能 够 
得 到 一 个 可 重复 的 随机 数 序列 。 但 从 多 个 线程 并 发 调用 random 函数 时 ， 这 种 条 件 就 不 再 成 立 了 。 


上 # 一 个 线程 不 安全 的 伪 随机 数 生成 器 random， 代 码 位 于 wrapper.c */ 
static unsigned intnext= 1; 


1 
2 
3 ”人 #*Iandom : 产生 0...32767 这 样 的 伪 随 机 数 序列 */ 

4 intrandom(void) 

SU 

6 next=next*1104625387 + 54321; 

将 Tetum ((unsigned int)(next/65535)) % 32768: 

Le 

9 。*srand: 为 random 设置 种 子 */ 

10 void srand(unsigned int seed) 

Wi 

1 Dext= seed: 

13 } 

将 这 类 函数 变 成 线程 安全 的 方法 是 重 写 函 数 ， 删 去 作为 隐 含 状态 的 静态 变量 ， 将 状态 信息 保存 
到 由 调用 者 提供 的 参数 中 。 缺 点 是 还 要 修改 函数 调用 格式 。 如 果 一 个 大 型 软件 系统 中 有 大 量 的 调用 
位 置 ， 修 改 工作 量 很 大 ， 也 容易 出 错 。 

第 3 类 : 返回 指向 静态 变量 的 指针 的 函数 。 某 些 函数 ， 例 如 ctime、gethostbyname、inet_ntoa， 
它们 都 将 计算 结果 存放 到 一 个 静态 变量 中 ， 返 回 指向 这 个 静态 变量 的 指针 给 调用 者 。 如 果 并 发 线程 
中 调用 了 这 样 的 函数 ， 一 个 线程 调用 这 些 函 数 后 得 到 的 结果 就 很 可 能 被 另 一 个 线程 悄悄 覆盖 。 

有 两 种 方法 来 处 理 这 类 线程 不 安全 函数 。 一 种 是 重 写 函 数 ， 让 调用 者 传递 存放 结果 的 变量 的 地 
址 ， 消 除 所 有 共享 数据 ， 但 是 需要 修改 调用 函数 的 源 代码 。 如 果 函 数 的 源 代码 非常 复杂 或 者 没有 源 
代码 可 用 ， 就 不 能 修改 源 代码 。 这 时 可 采用 加 锁 /拷贝 方法 (lock-and-copy) 来 解决 。 基 本 思想 是 将 存 
放 返 回 值 的 静态 变量 看 成 临界 资源 , 将 函数 调用 看 成 临界 区 , 定义 一 个 互 斥 信号 量 (pthread mutex b， 
在 每 一 个 调用 位 置 ， 先 用 互 斥 信 号 量 加 锁 ， 再 调用 线程 不 安全 函数 ， 将 函数 返回 的 结果 拷贝 到 一 个 
私有 的 存储 器 位 置 ， 然 后 对 互 斥 锁 解锁 。 为 减少 对 调用 代码 所 做 的 修改 ， 可 定义 一 个 线程 安全 的 包 
装 函 数 ， 它 执行 加 锁 -拷贝 操作 ， 把 函数 的 返回 值 复制 到 调用 者 提供 的 位 置 ， 然 后 通过 调用 这 个 包装 
函数 来 取代 所 有 对 线程 不 安全 函数 的 调用 。 例 如 ， 以 下 代码 采用 加 锁 -拷贝 操作 实现 了 ctime 函数 的 
一 个 线程 安全 的 版 本 ctime ts。 


证 C 标准 库 函数 ctime 的 线程 安全 的 包装 函数 ctime_ts， 代 码 位 于 wrapper.c 中 。 
它 使 用 加 锁 -拷贝 技术 调用 一 个 第 3 类 线程 不 安全 函数 */ 

1 ”必定 义 互 斥 信号 量 并 初始 化 */ 

2 pthread mutex t mutex= PTHREAD MUTEX INITIALIZER: 
3 char*ctime ts(consttime t *timep ,char *resultp) 

Oy 

5 char *sharedp: 

6 pthread mutex lock(&mutex); 

7 

8 

多 


strepy(resultp, sharedp): 庆 将 函数 调用 结果 复制 到 调用 者 提供 的 位 置 */ 
pthread mutex unlock(&mutex); 

0 Tetum privatep: 

1 
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第 4 类 : 调用 线程 不 安全 函数 的 函数 。 如 果 函 数 了 调用 线程 不 安全 函数 g， 那 么 就 可 能 是 一 
个 线程 不 安全 函数 。 这 里 有 两 种 情况 : 如 果 g 是 第 2 类 函数 ， 依 赖 于 跨越 多 次 调用 的 状态 ， 则 工 也 
是 线程 不 安全 的 ， 需 要 重 写 g 才能 将 f 变 成 线程 安全 函数 。 如 果 g 是 第 1 类 或 第 3 类 函数 ， 就 可 以 
处 理 对 函数 g 的 调用 ， 将 f 转 换 成 线程 安全 函数 。ctime ts 就 是 一 个 示例 。 


*6.7.2 可 重 入 性 


有 一 类 重要 的 线程 安全 函数 ， 叫 作 可 重 入 函数 (reentrant function)， 其 特点 在 于 它们 具有 这 样 一 
种 属性 : 当 它 们 被 多 个 线程 调用 时 ， 不 会 引用 任何 共享 数据 。 尽 管线 程 安全 和 可 重 入 性 有 时 会 (不 正 
确 地 ) 被 用 作 同 义 词 ， 但 是 它们 之 间 还 是 有 清晰 的 技术 差别 的 ， 值 得 留意 。 图 6-24 展示 了 可 重 入 函 
数 、 线 程 安全 函数 和 线程 不 安全 函数 之 间 的 集合 关系 。 所 有 函数 的 集合 被 划分 成 不 相交 的 线程 安全 
和 线程 不 安全 函数 集合 。 可 重 入 函数 集合 是 线程 安全 函数 的 一 个 真子 集 。 
所 有 函数 集 


线程 安全 函数 集 


可 重 入 函数 集 


图 6-24 可 重 入 函数 、 线 程 安全 函数 和 线程 不 安全 函数 之 间 的 集合 关系 


可 重 入 函数 通常 要 比 不 可 重 入 的 线程 安全 函数 高 效 一 些 ， 因 为 它们 不 需要 同步 操作 。 更 进一步 
讲 , 将 第 2 类 线程 不 安全 函数 转换 为 线程 安全 函数 的 唯一 方法 就 是 重 写 它们 , 使 之 变 为 可 重 入 函数 。 
例如 ， 下 面 的 rand r 就 是 rand 函数 的 一 个 可 重 入 版 本 ， 其 关键 思想 是 用 调用 者 传递 进来 的 一 个 指针 
取代 静态 的 next 变量 。 

店 Tandom r 函数 的 源 代码 ， 它 是 random 函数 的 可 重 入 版 本 ， 代 码 位 于 wrapper.c */ 


中 int random r(unsigned int *nextp) 
{ 


Tetum ((unsigned int)(next/65535)) % 32768: 


2 
3 next=next*1104625387 + 54321; 
4 
5 


} 

检查 一 个 函数 是 否 为 可 重 入 函数 ， 有 时 很 麻烦 ， 因 为 有 两 种 情况 : 

(1) 如 果 所 有 的 参数 都 是 按 值 传递 的 ( 即 没有 指针 )， 并 且 所 有 的 数据 引用 都 是 本 地 的 自动 变量 
( 即 没 有 引用 静态 变量 或 全 局 变量 )， 我 们 称 该 函数 是 显 式 可 重 入 的 (explicitly reentrant)。 因 为 无 论 怎 
样 调用 它 ， 都 不 会 出 现 共享 变量 。 

(2) 如 果 把 假设 放宽 一 点 ， 人 允许 显 式 可 重 入 函数 的 一 些 参数 是 按 引 用 传递 的 (就 是 传递 变量 指 
针 )， 称 该 函数 是 隐 式 可 重 入 的 Gimplicitly reentrant)。 如 果 调 用 线程 小 心地 传递 指向 非 共 享 数 据 的 指 
针 ， 那 么 它 是 可 重 入 的 。 例 如 ，random r 函数 就 是 隐 式 可 重 入 的 。 

从 这 里 可 以 看 出 ， 可 重 入 性 有 时 既是 调用 者 的 属性 ， 也 是 被 调用 者 的 属性 ， 而 并 不 只 是 被 调用 
者 单独 所 有 的 属性 ， 清 楚 这 一 点 是 非常 重要 的 。 

如 思考 与 练习 题 6.29 上 面 的 ctime ts 函数 是 线程 安全 的 ， 但 不 是 可 重 入 的 。 请 解释 说 明 。 
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*6.7.3 ”线程 不 安全 库 函 数 

大 多 数 UNIX 库 函 数 , 包括 定义 在 标准 C 库 中 的 函数 (例如 malloc、 free realloc、 printf 和 scanf)， 
都 是 线程 安全 的 , 只 有 一 小 部 分 例外 。 表 6-3 列 出 了 常见 的 线程 不 安全 库 函 数 。 其 中 ，asctime、ctime 
和 localtime 是 在 不 同时 间 格 式 间 来 回转 换 时 经 常 使 用 的 函数 。gethostbyname、gethostbyaddr 和 
inet-ntoa 是 网 络 编程 常用 的 库 函 数 。strtok 是 用 来 分 析 字 符 串 的 函数 ， 但 已 经 过 时 。 


表 6-3 ”常见 的 线程 不 安全 库 函 数 


线程 不 安全 函数 所 属 的 线程 不 安全 类 型 线程 安全 版 本 
Tand 第 2 类 Tand T 
strtok 第 2 类 strtok T 
asctime 第 3 类 asctime T 
ctime 第 3 类 ctime T 
gethostbyaddr 第 3 类 gethostbyaddr 1 
gethostbyname 第 3 类 gethostbyname 1 
inet_ntoa 第 3 类 inet ntoa T 
localtime 第 3 类 localtime 1 


除了 rand 和 strtok 函数 以 外 ， 其 他 函数 都 属于 第 3 类 线程 不 安全 函数 ， 因 为 它们 都 返回 一 个 指 
向 静态 变量 的 指针 。 为 了 方便 用 户 编程 ，UNIX 系统 提供 大 多 数 线程 不 安全 函数 的 可 重 入 版 本 。 可 
重 入 版 本 的 名 字 总 以 "_r"' 后 级 结尾 。 例 如 ，gethostbyname 的 可 重 入 版 本 名 为 gethostbyname IT。 我 们 
建议 在 多 线程 程序 中 尽 可 能 使 用 这 些 函数 。 


*6.7.4 ”线程 竞 


线程 间 同步 一 般 位 于 线程 的 两 个 操作 之 间 ， 每 个 操作 通常 是 一 条 独立 的 程序 语句 。 这 种 同步 可 
用 前 面 介绍 的 信号 量 和 P/V 操作 来 实现 。 但 有 时 需要 同步 的 操作 并 不 是 一 条 完整 的 语句 ， 甚 至 不 像 
生产 者 /消费 者 问题 ， 每 次 同步 等 待 资源 都 不 同 。 这 类 同步 问题 的 分 析 与 识别 都 不 太 直 观 。 我 们 称 这 
种 同步 为 非常 规 同步 ，threadrace.c 是 一 个 有 非常 规 同步 要 求 的 示例 程序 。 主 线程 创建 了 四 个 对 等 线 
程 ， 并 传递 一 个 指向 其 唯一 整数 ID 的 指针 到 每 个 线程 。 每 个 对 等 线程 从 线程 参数 中 复制 其 了 D 到 一 
个 局 部 变量 中 (第 21 行 )， 然 后 输出 包含 这 个 ID 的 信息 。 


上 #threadracec， 一 个 线程 间 存在 竞争 的 程序 示例 。 编 译 命令 为 

gcc -0 threadrace threadrace.c -lpthread */ 
#include "wrapper.h" 

要 #define N 4 

3 

4 void *thread(void *vargp): 

5 

6 int main() 

7 { 

8 pthread t tid[N]: 

9 int 王 

10 

11 forG=0:i<N:itHH 
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12 pthread_create(&tidfi], NULL, thread, &)); 

13 for(i=0:i<N;itt) 

14 pthread join(tidfi], NULL): 

15 exit(0); 

16 } 

17 

18 片 线程 例 程 */ 

19 void *thread(void *vargp) 

20 { 

21 int myid = *((int *)vargp); 

Ee Usleep(]): 

2 printf"Output from thread %d\n", myid): 

24 Tetum NULL: 

25 } 

这 类 同步 约束 条 件 又 称 为 竞争 (race), 其 特征 是 : 
到 达 y 点 之 前 ， 到 达 其 控制 流 中 的 x 点 。 竞 争 一 般 因 


为 程序 员 假 定 线程 中 的 相关 操作 按照 某 种 特殊 的 顺序 


程序 的 正确 性 依赖 于 一 个 线程 要 在 另 一 个 线程 
共享 变量 或 共享 资源 而 起 ， 发 生 竞争 通常 是 因 
执行 ， 而 实际 上 还 存在 其 他 执行 顺序 。 竞 争 也 


可 以 存在 于 其 他 形式 的 并 发 流 中 ， 在 5.4.7 节 的 程序 procmaskl.c 中 ，handler 与 main 函数 之 间 的 并 


发 错误 也 是 因为 竞争 。 


race.c 看 上 去 虽然 非常 简单 ， 但 在 运行 时 却 得 到 以 下 不 正确 的 结果 : 


$ /hreadrace 

Output fom thread 0 
Output fom thread 2 
Output from thread 3 
Output from thread 3 


错误 是 由 每 个 对 等 线程 和 主线 程 之 间 的 竞争 引起 的 。 主线 程 在 第 12 行 创建 了 一 个 对 等 线程 , 并 
传递 一 个 指向 本 地 变量 i 的 指针 。 此 时 i 成 为 主线 程 与 对 等 线程 间 的 共享 变量 ， 在 第 11 行 的 计 H 下 
次 执行 ) 和 第 21 行 的 myid = *((int *)vargp) 中 ， 在 间接 引用 变量 i 这 两 个 操作 之 间 出 现 了 竞争 。 如 果 
对 等 线程 在 主线 程 下 一 次 执行 第 11 行 之 前 就 执行 第 21 行 , 那么 myid 变量 就 得 到 正确 的 人 D。 否则 ， 
就 包含 其 他 线程 的 ID， 因为 变量 i 已 递增 1。 在 我 们 的 运行 环境 中 ,了 D 为 1 和 2 的 线程 都 出 现 了 这 


样 的 错误 。 图 6-25 是 发 生 并 发 竞争 原因 的 图 解 。 


当然 ， 如 果 在 某 个 对 等 线程 执行 第 21 行 的 用 于 


读 取 线程 参数 的 代码 前 ， 主 线程 就 已 执行 到 第 


13 行 ， 甚 至 第 2、 第 3 次 执行 第 13 行 ， 那 么 运行 结果 还 会 出 现 其 他 错误 。 


主线 程 main 


12: pthread_create(&tid[i], NULL, thread, ‘D ) | (=0) 


对 等 线程 thread(void *vargp) 


TR 1 
[21: id- Yargpy | 


(myid=1) 


图 6-25 程序 threadrace.c 的 并 发 关系 和 竞争 分 析 : 对 等 线程 thread 的 局 部 变量 myid 是 对 主线 程 局 部 变量 i 的 引用 ， 
假设 执行 第 12 行 ，i 的 值 是 0， 对 等 线程 中 变量 myid 应 得 到 赋值 0， 但 由 于 第 11 行 和 第 22 行 具有 并 发 
关系 ， 若 第 11 行 先 于 第 22 行 执行 ，myid 就 得 到 错误 的 赋值 1， 导 致 竞争 


为 了 消除 竞争 ， 我 们 可 以 动态 地 为 每 个 线程 人 D 


分 配 一 个 独立 的 块 ， 并 将 指向 这 个 块 的 指针 传 


递 给 线程 例 程 ， 主 线程 与 对 等 线程 间 的 并 发 关系 如 图 6-26 所 示 。 
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主线 程 main 
12: ptr = Malloc(sizeof(int)); 


对 等 线程 thread(void *vargp) 


13:*ptr = i; (*ptr= 


14: pthread create(&tid[i], NULL, thread. ); | (i=0) #ptr 


6-26 图 6-25 中 竞争 的 消除 方法 : 主线 程 将 ptr 作为 参数 传递 给 对 等 线程 hread， 由 于 第 11 行 不 再 修改 *ptr, 假 
设 创建 对 等 线程 时 二 0， 无 论 两 个 线程 如 何 并 发 ， 对 等 线程 hread 都 能 从 *ptr 中 读 到 正确 的 线程 症 号 0 


修改 后 的 代码 为 norace.c， 其 中 第 12~14 行 是 创建 、 赋 值 和 传递 线程 D 的 独立 块 ， 为 避免 存储 


器 泄漏 ， 在 线程 例 程 中 必须 释放 这 些 块 (第 26 行 )。 
店 norace.c， 消 除 threadrace.c 中 竞争 后 的 修改 版 本 ， 编 译 命令 是 


gcc -0 norace norace.c —lpthread */ 


#include "wrapper.h" 
2 #define N 4 
3 
4 void *thread(void *vargp): 
5 
6 int main() 
7 { 
8 pthread ttid[N]: 
9 inti *ptr; 
10 
11 for(i=0;i<N;iH) { 
12 Ptr = malloc(sizeoftint)); 
13 *ptr=i; 
14 Pthread_create(&tid[i], NULL., thread, ptr); 
15 } 
16 for(i=0;i<N:it+) 
ji pthread_join(tid[i], NULL): 
18 exit(0); 
19 } 
20 


21 上 # 线程 例 程 */ 
22 void *thread(void *vargp) 


23 { 

24 int myid = *((int *)vargp); 

25 usleep(1); 

26 free(vargp): 

27 Printf("Output from thread %d\n", myid): 
28 Tetum NULL: 

29 } 

在 系统 上 运行 这 个 程序 后 ， 现 在 得 到 了 正确 的 结果 : 
S$ /norace 

Output from thread 0 

Output from thread 2 

Output from thread 3 
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各 ”思考 与 练习 题 6.30 分析 程 序 race.c 中 的 各 个 变量 都 有 哪 几 个 运行 实例 ， 有 哪些 共享 变量 ， 
各 由 哪些 线程 引用 ? 
有 ”思考 与 练习 题 6.31 在 程序 norace.c 中 ， 我 们 可 能 想 要 在 主线 程 的 第 15 行 后 立即 释放 已 分 
配 的 存储 器 块 ， 而 不 是 在 对 等 线程 中 释放 它们 。 但 这 个 方案 并 不 好 ， 为 什么 ? 
寻思 考 与 练习 题 6.32 

A. 在 程序 norace.c 中 ， 我 们 通过 为 每 个 整数 ID 分 配 一 个 独立 的 块 来 消除 竞争 。 给 出 一 种 不 调 
用 malloc 或 free 函数 的 不 同方 法 。 

B. 这 种 方法 的 利弊 是 什么 ? 


[EN 使 用 多 线程 提高 并 行 性 


到 目前 为 止 ， 在 对 并 发 编程 的 讨论 中 ， 我 们 假设 并 发 线程 是 在 单 处 理 器 系统 上 执行 的 。 然 而 ， 
许多 现代 计算 机 具有 多 核 处 理 器 。 并 发 程序 通常 在 这 样 的 计算 机 上 运行 得 更 快 ， 因 为 操作 系统 内 核 
在 多 个 核 上 并 行 地 调度 这 些 并 发 线程 ， 而 不 是 在 单个 核 上 顺序 地 调度 。 对 于 繁忙 的 Web 服务 器 、 数 
据 库 服务 器 和 大 型 科学 计算 应 用 ,开发 并 行 性 至 关 重 要 ; 像 Web 浏览 器 、 电 子 表格 处 理 程序 和 文档 
处 理 程序 这 样 的 主流 应 用 ， 并 行 性 也 变 得 越 来 越 普遍 。 


6.8.1 顺序 程序 、 并 发 程序 和 并 行程 序 


图 6-27 给 出 了 顺序 程序 、 并 发 程序 和 并 行程 序 之 间 的 集合 关系 。 所 有 程序 的 集合 能 够 划分 成 不 
相交 的 顺序 程序 集合 和 并 发 程序 集合 。 顺 序 程序 只 有 一 条 届 辑 流 ， 并 发 程序 有 多 条 并 发 流 。 并 行程 
序 是 一 个 运行 在 多 个 处 理 器 上 的 并 发 程序 ， 并 行程 序 集合 是 并 发 程序 集合 的 一 个 真子 集 。 


并 发 程序 


图 6-27 顺序 程序 集合 、 并 发 程序 集合 和 并 行程 序 集合 之 间 的 关系 


只 有 并 发 程序 才能 在 多 处 理 器 上 并 行 执行 ， 以 获得 更 高 的 运行 效率 。 一 般 来 说 ， 不 同 进程 之 间 
是 可 并 发 的 ， 进 程 内 不 同 线程 之 间 也 是 并 发 的 。 通 常 不 同 的 进程 代表 不 同 的 任务 或 应 用 ， 讨 论 线程 
内 并 发 更 有 意义 ， 只 有 它 能 利用 多 处 理 器 系统 的 计算 能 力 ， 提 高 线程 的 运行 效率 。 并 行程 序 是 一 种 
并 发 程序 ， 只 有 当 一 个 程序 具有 足够 多 的 可 并 发 代码 时 ， 才 能 创建 多 个 线程 ， 让 其 并 行 执行 。 因 此 ， 
一 个 程序 中 可 并 发 代码 的 比例 对 其 并 行 执行 性 能 影响 很 大 。 在 这 里 用 一 个 理想 案例 做 定量 分 析 。 

假设 某 个 多 线程 并 发 应 用 的 代码 由 不 可 并 发 部 分 和 可 并 发 部 分 构成 ， 这 两 部 分 代码 在 单 处 理 器 
上 的 执行 时 间 分 别 为 政和 大， 不 考虑 线程 管理 开销 ， 该 程序 在 单 处 理 器 系统 上 运行 所 需 时 间 为 

T=Ts+tT 
再 假定 可 并 发 部 分 的 负载 可 均匀 地 划分 为 n 个 子 任务 ， 由 个 线程 在 具有 n 个 处 理 器 的 系统 上 


并 行 执行 ， 执 行 每 个 线程 仅 需 时 间 下 /za ， 该 程序 现在 的 运行 时 间 为 : 
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T,=T+T/n 

从 该 式 可 以 看 出 ， 线 程 数 和 处 理 器 数 n 越 多 ， 程 序 运行 时 间 就 越 少 。 

假设 由 于 共享 变量 互 斥 访问 等 原因 , 每 个 线程 和 执行 时 间 为 1 的 一 段 代码 必须 互 斥 地 串 行 执行 ， 
则 可 并 发 部 分 在 单机 上 的 执行 时 间 减 至 再 -zt 而 不 可 并 发 部 分 在 单机 上 的 执行 时 间 增 至 Tstnt。 该 
程序 在 具有 个 处 理 器 的 系统 上 的 并 行 执行 时 间 为 : 

7T'=T Pe = 

程序 总 的 运行 时 间 增 加 了 (n - D1。 因此， 我 们 在 编写 多 线程 并 发 程序 时 ， 为 提高 程序 的 并 行 执 
行 性 能 ， 应 尽量 减少 不 可 并 发 代码 。 在 图 6-12 所 示 的 用 互 斥 锁 协 调 对 共享 变量 访问 的 示例 中 ,我 们 
主张 互 斥 锁 保护 的 代码 越 少 越 好 , 就 是 这 个 原因 。 示 例 程序 psum64.c 通过 精心 设计 避免 了 对 等 线程 
对 共享 变量 的 并 发 访问 ， 从 而 消除 了 对 等 线程 内 的 不 可 并 发 代码 。 


6.8.2 ”并 行程 序 应 用 示例 


下 面 的 示例 程序 psum64.c 用 线程 技术 并 行 地 对 数列 0,1,…, n - 1 求 和 。 该 程序 还 直接 用 解析 表 
达 式 n(n - 1)/2 计算 结果 , 用 于 对 并 行程 序 计算 结果 的 正确 性 进行 验证 。 虽然 这 是 一 个 逻辑 结构 非常 
简单 的 程序 ， 但 能 帮助 读者 理解 并 行程 序 设计 思想 。 

该 程序 采用 最 直观 的 方法 给 各 线程 分 配 任务 : 将 序列 划分 成 t 个 不 相交 的 区 域 ， 设 置 给 线程 ， 
为 每 个 线程 分 配 一 个 任务 区 域 。 为 进一步 简化 问题 ,假设 n 是 t 的 倍数 ,每 个 区 域 有 mt 个 元 素 。 主 
线程 创建 t 个 并 发 的 对 等 线程 ， 对 等 线程 式 计算 部 分 和 Sk，Sk 是 区 域 k 中 元 素 的 和 。 主 线程 对 所 
有 Sk 进行 汇总 相 加 ， 计 算出 最 终结 果 。 下 面 给 出 psum64.c 的 变量 定义 和 主 函数 。 


=T.+Er(n_l)t 
n 


族 psum64.c 的 变量 定义 和 主 函 数 ， 它 创建 多 个 线程 来 计算 一 个 序列 中 各 元 素 的 和 ， 编 译 命令 为 
gcc -0 psum64 psum64.c -lpthread #/ 

1 #include "wrapper.h" 

2 #define MAXTHREADS 32 

3 

4 void *sum(void *vargp); 

1 

6 上 # 全 局 共享 变量 */ 

je unsigned long long psum64[MAXTHREADS]: /* 每 个 线程 汇总 部 分 和 */ 
8 unsigned long long nelems_per thread: /* 每 个 线程 汇总 元 素 个 数 */ 
| 

10 int main(int argc , char **argv) 

11 { 

12 Unsigned long long i. nelems . log_nelems . nthreads . result = 0: 
13 pthread ttid[MAXTHREADS]: 

14 intmyid[MAXTHREADS]: 

15 

16 上 获取 输入 参数 沁 

条 让 (argc =3) { 

18 Printf ("Usage: %s <nthreads><log nelems>m" .argv [0]) : 
19 exit(0): 

20 } 

21 nthreads = atoi(argv [1] ) : 
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22 log nelems = atoi(argv[2)): 

23 nelems 一 (ILL <<log nelems); 。 /*1LL 是 64 位 的 longlong 整数 常量 */ 
24 nelems per thread = nelems /nthreads: 

25 

26 刻 创 建 对 等 线程 并 等 待 它们 结束 */ 

27 for (i=0:i<nthreads:; i++) { 

28 myid [1]=i:; 

29 pthread_create (&tid [i], NULL, sum, &myid[i]): 
30 } 

31 for (i=0;i<nthreads: it+) 

32 pthread join(tid[i] NULT) : 

33 

34 将 每 个 线程 汇总 的 部 分 和 加 起 来 */ 

35 for (i=0;i<nthreads; it+) 

36 Tesult += psum64[i]:; 

37 

38 人 # 检 查 最 终结 果 沁 

39 让 (result 一 (nelems*(nelems-1))/2) 

40 Printf("Comect: result=%ld\n" , result); 
41 else 

42 Printf("Error: result=%ld\n" , result); 
43 

44 exit(0); 

45 } 


首先 ,第 7 和 第 8 行将 累加 和 、 元 素 个 数 相关 变量 定义 成 64 位 长 的 无 符号 整数 类 型 unsigned long 
long， 以 保证 累加 和 不 溢出 。 第 23 行将 64 位 整数 常量 1LL 左 移 , 得 到 累加 的 整数 个 数 。 在 第 27~32 
行 ， 主 线程 创建 对 等 线程 ， 然 后 等 待 它们 结束 。 主 线程 给 每 个 对 等 线程 传递 一 个 小 的 整数 ， 作 为 唯 
一 的 线程 了 Dp。 每 个 对 等 线程 会 用 它 的 线程 ID 来 决定 负责 对 哪 一 段子 序列 求 和 。 在 对 等 线程 终止 后 ， 
数组 psum64 包含 对 等 线程 计算 出 来 的 部 分 和 。 然 后 主线 程 对 数组 psum64 的 各 元 素 值 进行 汇总 (第 


35 和 第 36 行 )， 使 用 公式 n(n-1)/2 验证 程序 执行 结果 的 正确 性 (第 39~42 行 )。 
下 面 给 出 psum64.c 中 线程 求 和 函数 sum 的 代码 。 
上 访 psum64.c 中 求 和 线程 函数 sum 的 代码 */ 


1 void *sum(void* vargp) 

2 { 

3 int myid = *((int*) vargp): 语 获得 线程 信号 */ 
4 unsigned long long begin = myid *nelems_per thread: /* 首 元 素 序号 所 
5 unsigned long long end = begin + nelems_per thread: ”/* 末 元 素 序号 */ 
6 ‘unsigned long long i. lsumF= 0: 

8 for (i=begin: i<end: it+) { 

9 lsum + 一 主 

10 } 

11 psum64[myid] = lsum: 

12 retum NULL: 

13 } 


第 3 行 从 线程 参数 中 提取 出 线程 也， 然后 用 这 个 D 来 计算 待 求 和 序列 所 在 区 域 (第 4-6 行 )。 
第 8~10 行将 本 线程 负责 处 理 的 序列 累加 到 局 部 变量 lsum, 第 11 行将 lsum 复制 到 数组 psum64 中 对 
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应 的 元 素 中 。 

读者 可 以 注意 到 ， 本 例 未 使 用 任何 互 斥 锁 对 共享 变量 的 访问 进行 限制 ， 其 方法 是 通过 恰当 的 变 
量 设置 ， 消 除 竞争 和 多 个 线程 并 发 访问 共享 变量 的 现象 : 

(1) 主线 程 (main 函数 的 第 28 行 ) 将 对 等 线程 的 ID 保存 到 线程 专属 的 数组 元 素 中 ， 因 此 无 论 何 
时 执行 对 等 线程 (sum 函数 的 第 3 行 ), 都 可 读 到 正确 的 线程 ID, 从 而 消除 了 因 pthread_create 调用 (main 
函数 的 第 29 行 ) 第 四 个 参数 可 能 引起 的 竞争 。 

(2) 在 sum 函数 的 第 9 行 ， 对 等 线程 在 工作 过 程 中 将 部 分 和 保存 在 非 共 享 的 局 部 变量 lsum 中 ， 
自然 不 必 加 锁 ， 第 11 行将 计算 结果 复制 到 与 主线 程 共享 的 全 部 数组 元 素 psum64[myid] 中 ， 虽 然 主 
线程 (mian 函数 的 第 36 行 ) 要 读 取 该 部 分 和 , 但 该 操作 完全 是 在 对 等 线程 结束 后 执行 的 , 因此 主线 程 
和 对 等 线程 也 没有 对 共享 变量 psum64 进行 并 发 访问 ， 也 不 需要 加 锁 。 

由 于 互 斥 锁 会 导致 操作 共享 变量 的 代码 串 行 执行 ， 降 低 应 用 程序 性 能 。 因 此 ， 通 过 合理 规划 变 
量 ， 减 少 变量 共享 和 对 共享 变量 的 并 发 操作 ， 少 用 甚至 不 用 互 斥 锁 ， 有 助 于 获得 更 高 的 运行 性 能 。 
本 例 值得 借鉴 。 当然， 减少 变量 共享 和 并 发 访问 ， 可 能 增加 存储 开销 ， 有 时 相当 于 在 性 能 和 存储 开 
销 之 间 做 了 折 中 。 

现在 编译 该 程序 ， 在 配置 了 两 个 CPU 核 的 Linux 虚拟 机 上 执行 该 程序 ， 验 证 结果 是 否 正确 ， 并 
用 time 命令 测量 执行 时 间 : 

Sgcec -0 psum64 psum64.c -L. -iwrapper -lpthread 

Stme psum64 1 30 

Correct Result=576460751766552576 
Real 0m3.264s 

User Om3.252s 

sys Om0.000s 

time psum64 2 30 

Correct Result=576460751766552576 
Teal Oml.556s 

user Om3.404s 

sys Om0.000s 

Stme psum64 4 30 

Correct Result=576460751766552576 
Teal Oml.656s 

user Om3.404s 

SyS Om0.000s 

启动 命令 中 ， 参 数 argv[1] 为 线程 数 ， 参 数 argv[2] 为 求 和 的 数值 范围 指数 ， 如 30 表示 数值 范围 
为 0~2”- 1。 用 工具 time 测量 程序 执行 时 ， 给 出 了 三 个 时 间 ， 其 中 user 是 执行 用 户 态 代码 消耗 的 
CPU 时 间 ; sys 是 程序 在 内 核 态 的 执行 时 间 ; real 是 墙 上 时 间 ， 是 从 程序 启动 到 终止 所 花 的 时 间 ， 包 
含 了 程序 占用 的 CPU 时 间 ， 以 及 在 此 期 间 CPU 转 去 执行 系统 管理 和 其 他 进程 所 花 时 间 之 和 。 执 行 
结果 表明 ， 当 线程 数 分 别 为 1、2、4 时 ， 求 得 的 结果 都 是 正确 的 。 从 程序 执行 用 时 来 看 ， 采 用 两 个 
线程 所 用 的 实际 时 间 大 约 为 单线 程 的 50%， 表 明 两 线程 并 行使 程序 执行 性 能 提高 了 一 倍 。 但 四 线程 
情况 与 两 线程 情况 的 性 能 几乎 无 差别 , 因此 多 线程 并 发 性 能 的 提升 倍数 最 多 为 CPU 数 或 CPU 核 数 。 

图 6-28 给 出 了 程序 psum64.c 在 某 四 核 处 理 器 计算 机 上 的 运行 时 间 与 线程 数 的 关系 ， 求 和 数值 
范围 为 0-2" - 1。 可 以 看 到 ， 随 着 线程 数 的 增加 ， 运 行 时 间 减 少 。 增 加 到 四 个 线程 后 ， 运 行 时 间 趋 
于 平稳 。 但 增加 到 16 个 线程 后 , 运行 时 间 反 而 呈现 增加 趋势 ,这 是 由 于 多 个 线程 被 分 配 到 同一 个 核 
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上 ， 从 而 增加 了 线程 上 下 文 切换 的 开销 。 因 此 ， 在 规划 并 行程 序 时 ， 线 程 数 不 宜 太 多 。 


1 2 4 8 ”16 线程 数 
图 6-28 程序 psum64.c 在 四 核 处 理 器 计算 机 上 对 有 23 个 元 素 的 序列 求 和 的 性 能 


虽然 绝对 运行 时 间 是 衡量 程序 性 能 的 终极 指标 ， 但 还 是 有 一 些 有 用 的 相对 衡量 标准 ， 称 为 加 速 
比 和 效率 ， 它 们 能 够 说 明 并 行程 序 是 否 对 潜在 并 行 性 进行 了 充分 挖掘 。 
并 行程 序 的 加 速 比 speedup) 通 常 定义 为 : 
Sn 到 T/T, 


其 中 , p 是 处 理 器 核 的 数量 ， 有 是 在 p 核 计算 机 上 的 运行 时 间 。 当 7 是 程序 顺序 版 本 的 执行 时 
间 时 ，5, 称 为 绝对 加 速 比 (absolute speedup)。 当 是 程序 的 并 行 版 本 在 一 个 核 上 的 执行 时 间 时 ，5。 
称 为 相对 加 速 比 (relative speedup)。 绝 对 加 速 比 相 比 相对 加 速 比 能 更 真实 地 衡量 并 行 性 能 ， 因 为 并 行 
程序 在 单 处 理 器 上 运行 时 ， 受 同步 开销 影响 使 分 子 变 大 ， 从 而 增 大 相对 加 速 比 。 然 而 ， 绝 对 加 速 比 
要 比 相对 加 速 比 更 难以 测量 ， 因 为 测量 绝对 加 速 比 需要 程序 的 两 种 不 同 的 版 本 。 对 于 复杂 的 并 行程 
序 ， 由 于 代码 过 于 复杂 或 源 代 码 不 可 得 ， 为 其 编写 一 个 独立 的 顺序 版 本 是 不 太 实际 的 。 

衡量 并 行程 序 性 能 的 另 一 个 指标 是 效率 (efficiency)， 定 义 为 : 


E,=5,/p=T/pT, 


它 是 数值 范围 为 0~100 的 百分比 。 效 率 用 于 度量 并 行 化 带 来 的 开销 。 高 效率 的 程序 比 低 效率 的 
程序 在 有 用 的 工作 上 花费 更 多 的 时 间 ， 在 同步 和 通信 上 花费 更 少 的 时 间 。 

6-29 给 出 了 并 行 求 和 示例 程序 的 各 个 加 速 比 和 效率 测量 值 。 该 程序 在 线程 数 不 超 过 8 时， 效 
率 大 于 95%， 接 近 理 想 情 况 。 一 般 来 说 ， 效 率 与 问题 本 身 可 并 发 性 及 并 发 程序 对 问题 并 发 性 的 挖掘 
能 力 密切 相关 。 并 发 编程 是 一 个 非常 活跃 的 计算 机 科学 研究 领域 ， 随 着 商用 计算 机 系统 的 CPU 数 、 
CPU 核 数 不 断 增加 ， 并 行 编程 的 应 用 将 变 得 越 来 越 广泛 。 

线程 数 ( 
CPU 核 数 (p) 1 
运行 时 间 (T;) 1.57 


加 速 比 (Sy) 
效率 (E;) 


图 6-29 图 6-28 中 执行 时 间 的 加 速 比 和 并 行 效率 
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旨 思考 与 练习 题 6.33 对 于 表 6-4 中 的 并 行程 序 ， 填 写 空白 处 。 


表 6-4 示例 并 行程 序 


线程 数 () 
CPU 核 数 (p) 
运行 时 间 (7o) 
加 速 比 (So) 
效率 (6E) 
思考 与 练习 题 6.34 psum64.c 中 有 哪些 共享 变量 ， 各 由 哪些 线程 引用 ， 是 否 存在 并 发 访问 ， 
为 何 程序 不 需要 对 共享 变量 加 锁 ? 


6.8.3 ”使 用 线程 管理 多 个 并 发 活动 


传统 应 用 程序 只 有 一 个 控制 流 ， 当 执行 过 程 中 需要 等 待 用 户 输入 、 网 络 数据 或 其 他 事件 时 ， 整 
个 程序 必须 停 下 来 ， 不 能 做 有 用 工作 ，CPU 被 调度 给 其 他 进程 使 用 。 如 果 应 用 程序 需要 同时 等 待 两 
个 事件 ， 如 同时 等 待 用 户 输入 和 网 络 数据 ， 采 用 传统 的 程序 模型 甚至 很 难 实现 。 多 线程 为 解决 这 类 
问题 提供 了 一 种 易于 理解 的 解决 方案 。 

下 面 的 threadapp2.c 是 一 个 应 用 示例 。 这 是 一 个 单机 聊天 程序 ， 它 在 两 个 终端 窗口 A 和 B 中 作 
为 两 个 进程 并 发 执行 。 每 个 进程 都 从 标准 输入 读 取 输 入 ， 发 送 给 对 方 ， 同 时 接收 来 自 对 方 的 信息 ， 
显示 出 来 ， 双 方 通过 两 个 FIFO 管道 通信 (关于 FIFO 管道 的 概念 和 使 用 ,参阅 7.1.2 节 )。 由 于 每 个 进 
程 都 要 同时 等 待 从 标准 输入 和 管道 读 取信 息 ， 我 们 创建 两 个 线程 来 做 这 两 件 事 情 : 线程 mysend 负 
责 从 标准 输入 读 取 数据 ， 并 发 送 给 对 方 ; 线程 myreceive 从 管道 接收 信息 ， 并 显示 出 来 。 


片 fhreadapp2.c 的 源 代 码 ， 这 是 一 个 多 活动 并 发 线程 编程 应 用 示例 ， 编 译 命令 为 
gcc -0 threadapp2 threadapp2.c -L. -lwrapper -lpthread #/ 
#include “wrapperh” 

了 Void *mysend(void*); 

3 Void *myreceive(Void*); 

4 

5 int main(int argc.char *argv[]) 

6 { 

沁 int in.out': 

8 pthread tt1.t2; 

加 

10 f(arge!=3){ 

11 printf("usage: threadapp2 writefifo readfifo\n”): 
i exit(1): 

13 

14 

15 pthread_create(&t] .NULL.mysend.(void*) argv[1]): 
16 pthread_create(&t2.NULL.myreceive,(void*) argv[2]): 
7 

18 pthread join(tL NULL): 

19 pthread join(D NULL): 

20 
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直 


void *mysend(void *varg) 


int out: 
char str[200]: 


out=open((char*)varg,O_WRONLY.0); 


while(1) { 
feets(str,200,stdin); 
Printft"%%s",str); 
write(out,str,strlen(str)+1):; 
这 stmcmp(str "end", 3)—0) 
break: 

} 


close(oub: 


} 


Void *myreceive(void* Varg) 


} 


int in 
char str[200]: 


in=open((char *)varg.O_RDONLY.,0); 
while(1) { 
read(in,str,200); 
printf("%6s", str); 
if(stmemp(str, "end",3)—0) 
break: 
} 
close(in); 


第 15 和 第 16 行 调用 pthread_create 函数 分 别 创 建 线程 mysend 和 myreceive， 它 们 用 argv[1] 和 


argv[2] 作 为 第 四 个 参数 ， 分 别 用 于 发 送 数 据 管 道 文 件 名 和 接收 数据 管道 文件 名 。 线 程 mysend 在 第 
28 行 打开 发 送 数据 的 管道 , 在 第 30 行 调用 feets 函数 ， 从 标准 输入 stdin 读 取 一 行文 本 到 字符 串 str， 
最 多 读 取 200 个 字符 ， 或 直到 换行 符 。 若 用 户 一 次 输入 不 超过 200 个 字符 ， 就 读 取 一 个 输入 行 ， 最 
后 一 个 字符 是 换行 符 \n'"， 外 加 一 个 串 结束 符 \0'。 第 32 行将 str 中 的 字符 串 写 入 管道 ， 发 送 给 另 一 聊 
天 方 ， 写 入 长 度 是 str 长 度 加 1， 这样 串 结束 符 ^0" 
决定 是 否 结束 循环 。 


写 入 管道 。 第 33 行 根据 输入 串 是 否 为 “end” 来 


线程 myreceive 在 第 44 行 打开 接收 信息 的 管道 后 ， 第 46 行 从 管道 读 入 包括 串 结束 符 的 信息 ， 


第 47 行 显示 输出 ， 第 48 行 判断 是 否 接收 到 字符 串 “end” 以 决定 是 否 终止 循环 。 


运行 前 ， 先 创建 两 个 FIFO 管道 fifo a 和 fifo b， 分 别 用 于 A 到 B、B 到 A 的 数据 传递 。 
Smyyo fjoa Jo 
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然后 在 两 个 不 同 的 终端 窗口 中 执行 该 程序 ， 命 令 行 参数 argv[1] 为 发 送 数据 的 管道 文件 ，argv[2] 
为 接收 数据 的 管道 文件 。 


终端 窗口 1: 终端 窗口 2: 
$Ahreadapp? ffoa Jp SMAhreadapp? Jp b ffoa 
Hello Hello 

Higuy higuy 

end end 

end end 

国 S$ 


这 两 个 聊天 程序 实现 了 双向 数据 传输 ， 双 方 输入 end 后 双方 聊天 结束 。 
喝 ” 思考 与 练习 题 6.35 在 threadapp2.c 中 有 哪些 共享 变量 ， 程 序 中 为 何 没有 对 共享 变量 的 加 锁 
操作 ? 


[本 章 小 结 


线程 是 进程 内 部 的 一 条 执行 线索 ， 线 程 共享 进程 内 的 资源 和 地 址 空间 ， 采 用 多 线程 编程 技术 可 
以 方便 进程 管理 多 项 并 发 活动 ， 利 用 多 CPU 系统 强大 的 计算 能 力 ， 提 高 程序 运行 性 能 。 

多 线程 编程 的 主要 优势 是 线程 之 间 共享 变量 更 方便 ,但 如 果 多 个 线程 对 共享 变量 执行 并 发 操作 
就 很 容易 引入 同步 错误 。 根 据 并 发 线程 对 共享 变量 的 访问 要 求 ， 线 程 间 协 同一 般 有 同步 和 互 斥 两 种 
情况 。 互 斥 是 指 多 线程 访问 需要 独 享 的 资源 时 ， 必 须 以 排他 方式 操作 共享 资源 ， 同 步 是 指 两 个 线程 
的 某 些 操作 必须 以 某 种 先后 顺序 执行 。 进 程 间 如 果 共享 资源 或 共享 变量 ， 也 存在 同步 与 互 斥 问题 ， 
解决 方法 在 概念 上 与 线程 的 同步 与 互 斥 相同 。 多 线程 同步 有 两 个 经 典 同步 问题 : 生产 者 /消费 者 问题 
和 读者 / 写 者 问题 ， 很 多 应 用 都 可 映射 到 这 两 种 模型 之 一 。 

现代 操作 系统 实现 了 一 种 称 为 信号 量 的 设施 ， 它 是 一 种 特殊 计数 器 ， 提 供 wait、signal 两 个 原 
语 ， 进 行 减 1 和 加 1 操作 ， 用 于 实现 并 发 线程 的 同步 与 互 斥 。 为 方便 设计 同步 算法 ， 很 多 系统 还 提 
供 了 AND 型 信号 量 、 信 号 量 集 、 条 件 变量 和 管 程 等 同步 设施 。 

Linux 系统 支持 广 为 接 受 的 Pthreads 多 线程 编程 规范 ， 可 在 进程 内 创建 多 个 并 发 活动 ， 线 程 之 
间 共 享 进程 的 资源 和 地 址 空间 ， 给 任务 间 交 互 带 来 极 大 方便 。Pthreads 多 线程 编程 接口 容易 理解 ， 
便于 使 用 ， 提 供 了 用 于 线程 创建 、 终 止 、 归 并 、 取 消 等 的 一 系列 API 函数 。Pthreads 规范 实现 的 信 
号 量 类 型 是 sem t， 对 应 wait、signal 的 函数 是 sem_wait 和 sem_post。 用 这 些 函 数 可 编写 能 实际 运 
行 的 代码 。 

线程 的 并 发 也 带 来 一 些 其 他 问题 ， 要 求 被 线程 调用 的 函数 必须 具有 一 种 称 为 线程 安全 的 属性 ， 
线程 不 安全 函数 需要 转换 为 线程 安全 函数 才能 被 线程 调用 。 可 重 入 函数 是 线程 安全 函数 的 一 个 真子 
集 ， 它 不 访问 任何 共享 数据 ， 通 常 比 不 可 重 入 函数 更 高 效 ， 因 为 它们 不 需要 任何 同步 原 语 。 竞 争 是 
并 发 程序 中 出 现 的 另 一 个 问题 。 当 程序 员 错 误 地 假设 线程 的 逻辑 流 具有 某 种 执行 顺序 时 ， 可 能 发 生 
竞争 。 很 多 情况 下 ， 竞 争 因 变 量 地 址 作为 函数 参数 传 给 其 他 并 发 线程 共享 所 致 ， 可 通过 为 共享 数据 
创建 不 同 变量 来 解决 。 
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课 后 作业 


如 思考 与 练习 题 6.36 编写 一 个 程序 ， 创 建 两 个 对 等 线程 T1、T2， 分 别 计算 数列 1、2、.…、 
N 的 和 以 及 平方 和 的 平方 根 , 主线 程 准备 数据 和 输出 结果 .。 主 线程 利用 全 局 变量 与 T1 交换 数据 ， 
通过 pthread_ create、pthread_exit 调用 参数 与 线程 T2 交换 数据 。 

到” 思考 与 练习 题 6.37 考虑 赋值 语句 的 汇编 代码 实现 ， 分 析 下 面 的 程序 有 哪 几 种 可 能 的 输出 
结果 。 


int k=0: 

void * thread(void *arg) 
k=k+10; 

} 

int main() 

{ 
pthread tt1,t2,t3; 
pthread_create(&t1,NULL .thread, NULL): 
pthread_create(&t2,NULL ,thread, NULL): 
pthread_create(&t3,NULL .thread, NULL): 
pthread join(tl,NULL): 
pthread join(t2,NULL): 
pthread join(t3,NULL): 
printf("k=%d\n",k); 

} 


思考 与 练习 题 6.38 ”考虑 赋值 语句 的 汇编 代码 实现 ， 分 析 下 面 的 程序 有 哪 几 种 可 能 的 输出 结果 。 


int x=y=0; 
void * thread1(void *arg) { x=y+S:} 
void * thread2(void *arg) { y=x+10;} 


int main() 

* 
pthread tt1,t2,t3; 
pthread_create(&t1.NULL.threadl.NULL): 
pthread_create(&t2.NULL.thread2.NULL): 


pthread_ join(tL.NULL): 

pthread_ join(t2.NULL): 

Printf("x=%d y=%d\n".x,y): 
} 


寻思 考 与 练习 题 6.39 ”阅读 下 列 程序 ， 画 出 程序 的 并 发 关系 图 ， 给 出 程序 中 4 个 位 置 的 指定 变量 
有 哪 几 种 可 能 的 结果 。 


int flag=1:; 
voidfinc0 cc{ flag=flag+5:} 
void main( ) 
{intstatus, ret: 
Pid tpid: 
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void func( ); 
flag =flag + 15: // 间 题 1: flag=? 
printf("1st question: flag=%6d\n",flag): 


signal(SIGUSR 1 func): 
让 (pid=fork0 ) { 
flag =flag +5: // 间 题 2: flag=? 
Printf("2nd question: flag=%d\n",flag); 
kill(pid, SIGUSR1): 
wait (&status): 
Tet=WEXITSTATUS(status); 
Printf("5th question: status=%d\n", ret); // 问 题 3: ret=? 
0 
else { // 于 进程 
fag=fag+50: /问题 4: flag=? 
Printf("3rd question: flag=%d\n" flag); 
exit (80); 


} 
绪 * 思 考 与 练习 题 6.40 ”编写 程序 测量 pthread_create、fork 两 个 函数 的 运行 时 间 ， 并 进行 比较 。 
虽 ” 思考 与 练习 题 6.41 分析 下 面 程序 中 每 个 变量 各 有 哪 几 个 运行 实例 ， 哪 些 变 量 是 共享 变量 ， 它 
们 由 哪些 线程 引用 ， 哪 些 共享 变量 被 并 发 读 写 。 


#define N 4 
void *thread(void *vargp); 
int a[10*N]; 
int cnt[N], sum=0; 
intmain0 
{ 
pthread t tid[N]; 
int ik: 
for (k=0; k<10*N: it+H alk]=k: 
for(i=0;i<N:it) 
pthread_create(&tid[i], NULL. thread, &i): 
for(i=0;i<N:it) 
pthread_join(tid[i], NULL): 


for(i=0; i<N; It); 
sum=sunrhcnt[j]: 
Printf("the sum is %d\n", sum): 
exit(0); 
} 
void *thread(void *vargp) 
{ 
int myid =*((int *)vargp): 
int k; 
cnt[myid]=0; 
for(k=10*myid; k<10*myid+10:k++) 
cnt[myid]j=cnt[myid]+a[k]: 
TetunNULL: 
} 
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彩 ” 思考 与 练习 题 642 有 三 个 用 户 进程 A、B 和 C， 在 运行 过 程 中 都 要 使 用 系统 中 的 一 台 打 印 机 
输出 计算 结果 。 试 说 明 进程 A、B、C 之 间 存 在 什么 样 的 制约 关系 ? 为 保证 这 三 个 进程 能 正确 打印 
出 各 自 的 结果 ， 请 用 信号 量 和 P/V 操作 写 出 各 自 的 有 关 获 取 、 使 用 打印 机 的 算法 描述 。 和 要求 给 出 信号 
量 的 含义 和 初 值 。 


ProcessAO ProcessBO ProcessC() 
{ { { 

打印 输出 : 打印 输出 : 打印 输出 ; 
} 


和 ”思考 与 练习 题 6.43 兄弟 俩 共用 一 个 账号 ,他们 可 以 用 该 账号 到 任何 一 家 联网 的 银行 自动 存款 
或 取款 。 假 定 银行 的 服务 系统 由 “存款 (Savej” 和 “取款 (Take)” 两 个 并 发 线程 组 成 ， 且 规定 每 次 的 
存款 额 和 取款 额 总 是 100 元 。 若 进程 结构 如 下 : 

intamount=0; /全 局 变量 ， 账 号 余额 ， 初 值 为 0 


void Save(int ml) void Take(int m2) 
四 4 
ml =amount:; m2=amount; 
ml 一 ml 十 100; m2=m2-100; 
amount=ml amount=m2 


} } 

请 回答 下 列 问 题 : 

(1) 估计 该 系统 工作 时 会 出 现 怎样 的 错误 ， 为 什么 ? 

(2) 若 哥哥 先 存 了 两 次 钱 , 但 第 三 次 存 钱 时 弟弟 正在 取 钱 , 则 该 账号 上 可 能 出 现 的 余额 为 多 少 ? 
正确 的 余额 应 该 为 多 少 ? 

(3) 为 保证 系统 正确 工作 , 若 用 P/V 操作 来 管理 , 应 怎样 定义 信号 量 及 其 初 值 ? 解释 信号 量 的 作用 。 

(4) 在 程序 的 适当 位 置 加 上 了 操作 和 操作， 使 其 能 正确 工作 。 
惠 ” 思考 与 练习 题 6.44 ” 某 超 市 可 容纳 100 人 同时 购物 ， 入 口 处 备 有 篮子 ， 每 个 购物 者 可 持 一 个 篮 
子 入 内 购物 。 在 出 口 处 结账 ， 并 归还 篮子 。 出 口 和 入 口 仅 容纳 一 人 通过 。 请 用 P/V 操作 完成 购物 同 
步 算 法 。 
哆 + 思考 与 练习 题 6.45 某 火 车 站 有 一 车 库 ， 最 多 可 以 停 三 列 火车 ， 车 站 与 外 界 以 单轨 相通 ， 请 
用 P/V 操作 描述 经 过 该 车 站 的 过 程 。 
多 思考 与 练习 题 6.46 假设 n 个 并 发 进程 ,共享 m 个 共享 资源 ， 每 个 进程 最 多 申请 1 个 资源 , 信 
号 量 sem 的 取 值 范围 是 什么 ? 
和 ”思考 与 练习 题 6.47 信号 量 S 的 初 值 是 1， 进 程 对 信号 量 S 进行 5 次 P 操 作 、2 次 V 操作 后 ， 
现在 信号 量 S 的 值 是 多 少 ? 与 信号 量 S 相关 的 处 于 阻塞 状态 的 进程 有 几 个 ? 
多 ”思考 与 练习 题 6.48 编写 一 个 程序 , 创建 3 个 对 等 线程 , 假设 这 3 个 线程 的 人 D 分 别 为 A、B、C， 
每 个 线程 将 自己 的 ID 在 屏幕 上 打印 10 遍 ， 要 求 输出 结果 必须 按 ABC 的 顺序 显示 ， 如 ABCABC.. 
弗 ”思考 与 练习 题 6.49 四 个 进程 A、B、C、D 都 要 读 一 个 共享 文件 F， 系 统 允 许多 个 进程 同时 
读 文 件 F。 但 限制 是 进程 A 和 进程 C 不 能 同时 读 文件 F， 进 程 B 和 进程 D 也 不 能 同时 读 文件 上 。 
现 用 P/V 操作 进行 管理 ， 使 这 四 个 进程 并 发 执行 时 能 按 系统 要 求 使 用 文件 FE， 请 在 各 编号 处 填 入 
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适当 的 代码 。 
D] /信号 量 的 定义 与 初 什 
ProcessA() ProcessBO ProcessC() 
{ { 
D]; [4:; [9]; 
read F; read F; read F; 
BJ; [5]; [A 
} } } 


多 ”思考 与 练习 题 6.50 ”在 公共 汽车 上 ， 司机 的 活动 是 : 启动 车 辆 ， 正 常 运行 ， 到 站 停车 。 售 票 员 
的 活动 是 : 关 车 门 ， 售 票 ， 开 车门 。 在 公共 汽车 到 站 、 停 车 、 行 驶 的 过 程 中， 为 保证 乘客 安全 ， 必 
须 在 停车 后 开车 门 ， 在 关 车 门 后 启动 汽车 ， 用 信号 量 和 P/V 操作 实现 同步 关系 。 


司机 0 售票 员 0 
{ while(D){ { while(D){ 
<< 启 动车 辆 >> << 关 车 门 >> 


<< 正 常 行 驶 >> << 售 票 >> 


<< 到 站 停车 >> << 开 车 门 >> 
} J 
} } 


史 ”思考 与 练习 题 6.51 假设 一 个 进程 由 6 个 函数 S1I、S2、S3、S4、S5、S6 组 成 ， 要 求 按 图 6-30 
所 示 次 序 运行 。 请 问 应 设计 几 个 线程 ， 每 个 线程 执行 哪些 函数 ， 试 用 P/V 操作 表达 线程 并 发 执行 时 
的 同步 关系 。 


SS 


图 6-32 执行 次 序 


好 = 思考 与 练习 题 6.52 ”有 一 只 铁 笼 子 ， 每 次 只 能 放 入 一 只 动物 ， 猫 手 向 笼 中 放 入 老虎 ， 农 民 向 笼 
中 放 入 猪 ， 动 物 园 等 待 放 出 笼 中 的 老虎 ， 饭 店 等 待 取 走 笼 中 的 猪 。 将 猎手 、 动 物 园 、 农 民 、 人 饭店 看 
成 进程 ， 试 用 P/V 操作 实现 进程 同步 。 
寻思 考 与 练习 题 6.53 假设 三 个 线程 RR、W1、W2 共享 一 个 缓冲 器 B, 而 B 中 每 次 只 能 存放 一 个 
数 。 当 缓冲 器 中 没有 数 时 ， 进 程 民 可 以 从 输入 设备 读 入 的 数 存 放 到 缓冲 器 中 。 若 存放 到 缓冲 器 中 的 
是 奇数 ， 则 允许 进程 W1 将 其 取出 打印 ; 若 存放 到 缓冲 器 中 的 是 偶数 ， 则 允许 进程 W2 将 其 取出 打印 。 
(1) 写 出 三 个 并 发 线程 能 正确 工作 的 描述 代码 。 
(2) 写 出 能 在 Linux 环境 下 运行 的 三 个 并 发 线程 的 C 语言 代码 。 
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如" * 思 考 与 练习 题 6.54 有 的 文献 将 P/V 操作 的 语义 定义 为 如 下 所 示 : 


primitive wait(semaphore &S) // P 操作 primitive signal(semaphore &S) //V 操作 
* { 
S.value=S.value-1; // 资源 减 1 S.value=S.valuet+1; // 资源 数 加 1 
if(S.value<0) if(S.value<=0) // 判断 等 待 队 列 是 否 为 空 


block(S.L):; // 在 队列 SL 中 挂 起 wakeup(S.L); 。 // 唤醒 一 个 等 待 进程 
} 


} 


(1) 请 解释 这 个 方案 ， 也 可 以 利用 它 解决 前 面 的 资源 调度 和 同步 问题 。 

@) 对 于 n 个 进程 竞争 m 个 资源 的 场景 ， 信 号 量 sem 的 初 值 是 多 少 ? 当 sem<0 时 ，sem 的 物理 
含义 是 什么 ? 
和 ”思考 与 练习 题 6.55 有 四 个 进程 和 四 个 信箱 ， 进 程 间 借助 相 邻 信箱 传递 消息 ， 即 Pi 每 次 从 Mi 
中 取 一 条 消息 ， 经 加 工 后 送 入 Mit1， 其 中 Mi(i=0~3) 分 别 可 存放 3、3、2、2 条 消息 ， 如 图 6-31 所 
示 。 初 始 状态 下 ，M0 装 了 3 条 消息 ， 其 余 为 空 。 

(1) 试 以 P/V 操作 为 工具 ， 写 出 Pi G=0-3) 的 同步 工作 算法 。 

(2) 用 AND 型 信号 量 ， 写 出 Pi(i=0~3) 的 同步 工作 算法 

MI 


® oe 


6-31 消息 在 信箱 间 的 传递 
和 ”思考 与 练习 题 6.56 某 寺庙 有 小 和 尚 、 老 和 尚 若干 ， 有 一 水 红 ， 小 和 尚 提 水 入 红 供 老 和 尚 饮用 。 
水 红 可 容纳 10 桶 水 ,水 取 自 同一 井中 。 水 井 径 窜 ,每 次 只 能 用 一 个 桶 取水 。 水 桶 总 数 为 3。 每 次 入 、 
取 红 水 仅 为 1 桶 ， 且 不 可 同时 进行 。 给 出 小 和 尚 打 水 、 老 和 尚 喝 水 两 个 进程 的 算法 描述 ， 用 信号 量 
进行 同步 。 
2 * 思 考 与 练习 题 6.57 有 一 个 仓库 ， 可 以 存放 A 和 BB 两 种 产品 ， 但 要 求 : 

(1) 每 次 只 能 存 入 一 种 产品 (A 或 B)。 

(2) -N<A 产品 数量 -B 产品 数量 <M。 

其 中 ，N 和 M 是 正 整 数 。 试 用 P/V 操作 描述 产品 A 与 BB 的 入 库 过 程 。 
如 = * 思 考 与 练习 题 6.58 有 一 个 仓库 ， 存 放 两 种 零件 A 和 B， 最 大 库存 容量 各 为 mm。 有 一 车 间 不 
断 地 取 A 和 B 进行 装配 ， 每 次 各 取 一 个 。 为 避免 零件 锈蚀 ， 遵 循 先入 先 出 原则 。 有 两 家 供应 商 不 停 
地 供应 A 和 B。 为 保证 配套 和 库存 合理 ， 当 某 种 零件 的 数量 比 另 一 种 的 数量 超出 n(n<m) 个 时 ， 暂 停 
对 数量 大 的 零件 进货 ， 集 中 补充 数量 少 的 零件 。 使 用 P/V 操作 加 以 实现 。 
虽 ” 思考 与 练习 题 6.59 在 生产 者 /消费 者 代码 中 ， 假 设 缓冲 区 单元 数 是 20， 有 两 个 生产 者 线程 ， 
分 别 产生 1~1000、2~200 的 整数 ， 投 放 到 缓冲 区 队列 。 两 个 消费 者 线程 分 别 从 缓冲 区 队列 中 取得 数 
据 ， 如 果 取 到 奇数 ， 就 直接 输出 显示 ; 如 果 取 到 偶数 ， 就 取 反 后 输出 显示 。 消 费 者 线程 显示 数据 时 
要 标记 是 哪个 线程 输出 的 。 用 Pthreads 同步 机 制 改写 成 能 真正 执行 的 程序 ， 并 进行 测试 。 提 示 : 可 
基于 6.5.1 节 中 的 代码 进行 改写 。 
哆 思考 与 练习 题 6.60 在 6.5.1 节 的 同步 算法 中 ， 缓 冲 区 定义 、 读 写 指针 、 信 和 号 量 都 是 全 局 变量 ， 
管理 有 些 混 乱 ， 也 不 太 符合 要 尽量 减少 全 局 变量 设置 的 编程 规范 。 一 种 改进 方法 是 将 缓冲 区 及 相关 
的 变量 包装 到 一 个 类 型 为 sbuf t 的 结构 体 类 型 变量 中 , 将 同步 代码 添加 到 sbuf insert 和 sbuf remove 
孔 数 中 ， 这 样 生产 者 和 消费 者 线程 函数 就 不 需要 任何 同步 代码 了 。 
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void Thread Pi(sbuf t *sp) 
{ 
int item:; 
while (tue){ 
item=produce0: 
sbuf insert(item.sp): 


} 


void Thread_Ci(sbuf t*sp) 
{ 
int item; 
while (1D){ 
item=sbuf remove(sp); 
consume(item); 


} 
假设 sbuf t 的 定义 为 : 


typedef struct { 

int *buf: 

int cmn; 
int tail: 
int head; 
sem t mutex; 
sem tavail; 
sem tready; 
} sbuf t 


/ 生产 者 线程 ，sp 是 缓冲 区 指针 


1/ 产生 数据 
/ 向 缓冲 区 存放 数据 


/ 消费 者 线程 ，sp 是 缓冲 区 指针 


/ 从 缓冲 区 取 走 数据 
/ 消费 或 处 理 数据 


入 缓冲 区 数组 队列 */ 

入 缓冲 区 队列 容量 */ 

上 # 数据 读 出 指针 */ 

此 数据 写 入 指针 */ 

片 保护 对 缓冲 区 访问 的 互 斥 信号 量 */ 
此 空闲 单元 计数 信号 量 */ 

久 可 用 数据 项 计数 信号 量 */ 


创建 具有 了 个 单元 的 FIFO 缓冲 区 的 初始 化 代码 为 : 


void sbuf init(sbuf t *sp, int D) 

{ 
sp->buf =Cal loc(n, sizeof(int)): 
sp->head= sp->tail = 0: 
sp->cnt=n:; 
Sem init(&sp->mutex. 0. 1); 
Sem init(&sp->avail, 0, n): 
Sem init(&sp->ready. 0. 0): 

} 


请 用 Pthreads 同步 机 制 给 出 


上 # 创建 缓冲 区 队列 所 

上 # 初始 化 写 入 和 读 出 位 置 为 0 

上 # 初始 化 缓冲 区 队列 容量 */ 

庆 初始 化 互 斥 信号 量 */ 

庆 设置 空闲 单元 数 ， 初 值 为 N */ 

上 # 设置 可 用 数据 单元 数 ， 初 值 为 0*/ 


其 他 函数 的 代码 : 


void sbuf deinit(sbuf t *sp)/* 清理 缓冲 区 */ 
{ 和 # 在 下 面 填写 清除 缓冲 区 的 代码 */ 


} 


void sbuf insert(sbuf t*sp, int item) ”上 # 向 缓冲 区 队列 sp 的 末尾 插入 数据 item */ 
{ ” 在 下 面 填写 向 缓冲 区 插入 数据 的 代码 */ 
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} 


int sbuf remove(sbuf t *sp) 庆 从 缓冲 区 队列 sp 中 移 去 和 返回 队 首 数据 项 */ 
{ ”让 在 下 面 填写 从 缓冲 区 取 走 数据 的 代码 */ 


} 

用 本 题 的 同步 框架 实现 生产 者 /消费 者 问题 的 C 程 序 代码 并 测试 运行 。 
守 思考 与 练习 题 6.61 请 通过 分 析 研 究 后 说 明 ， 用 信号 量 和 P/V 操作 能 否 解 决 sigrace.c( 参 见 图 
5-23) 中 进程 流 与 信号 处 理 函 数 间 的 同步 问题 ? 为什么? 
二 思考 与 练习 题 6.62 ”请 通过 分 析 研究 后 说 明 ， 用 信号 量 和 P/V 操作 能 否 解决 threadrace.c( 参 见 
图 6-25) 中 的 竞争 问题 ?为 什么 ? 
各 思考 与 练习 题 6.63 有 一 座 桥 ， 如 图 6-32 所 示 ， 车 流 如 图 中 箭头 所 示 。 桥 上 不 允许 两 车 交会 ， 
但 允许 同方 向 多 辆 车 依次 通行 ( 即 桥 上 可 以 有 多 辆 同方 向 的 车 )。 用 信号 量 和 P/V 操作 实现 交通 管理 ， 
写 出 描述 代码 ， 以 防止 桥 上 发 生 交通 堵塞 。 


图 6-32 车 辆 在 桥 上 通行 
和 + 思考 与 练习 题 6.64 ”一 段 双向 行驶 公路 ， 由 于 山体 滑坡 ， 一 小 段 路 的 一 条 车 道 被 阻隔 ， 该 段 
公路 每 次 只 能 容纳 一 辆 车 通过 ， 同 一 方向 的 多 辆 车 可 以 紧 接着 通过 ， 如 图 6-33 所 示 ， 试 用 P/V 操作 
控制 此 过 程 。 


图 6-33 一段 公路 受 山体 滑坡 影响 


和 思考 与 练习 题 6.65 用 Pthreads 信号 量 , 编写 读者 / 写 者 问题 的 实现 代码 , 运行 并 分 析 结 果 是 否 
正确 。 

多 * 思 考 与 练习 题 6.66 ”理发 店 有 一 位 理发 师 、 一 把 理发 村 和 n 把 供 等 候 理发 的 顾客 坐 的 椅子 。 
如 果 没 有 顾客 ， 理 发 师 便 在 理发 椅 上 睡觉 。 当 顾客 到 来 时 ， 必 须 先 叫 醒 理发 师 。 理 发 师 正 在 理 
发 时 如 有 顾客 到 来 ,那么 如 果 有 空 椅子 ， 顾 客 就 坐 下 来 等 ; 否则 ， 顾客 离开 。 使 用 信号 量 和 P/V 
操作 描述 同步 过 程 。 

多 思考 与 练习 题 6.67 用 互 斥 锁 方法 实现 badcount.c 对 共享 变量 的 安全 访问 。 

各” 思考 与 练习 题 6.68 下 面 函 数 中 的 哪些 是 线程 安全 函数 ， 若 不 是 ， 请 将 其 改造 成 线程 安全 
函数 。 哪 些 是 可 重 入 函数 ， 如 果 不 是 ， 请 给 出 原因 ? 


(1) 程序 1: (2) 程序 2: 

void strcpy(char #lpszDest char *lpszSrc) static int sum _value = 0; 

和 void sum counterO { 
while(*lpszDest++=*IpszSre++) {}: Sum valuett; 


} } 
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(3) 程序 3: (4) 程序 4: 

char *strtoupper(char *string) extem unsigned char key: 

| void ciphher(char *str) 
static char buffer[MAX. STRING SIZE]: { 
int index; inti: 
for (index = 0; string[index]: index++) for(i=0: stti: +) 

bufferfindex] = toupper(string[index]): str[i]=(strfi}+key) % 256: 

buffer[index] =0; key=(key+1) % 256: 
Teturn buffer: } 


} 

引 思考 与 练习 题 6.69 ”用 加 锁 -拷贝 技术 实现 gethostbyname 的 一 个 线程 安全 而 又 不 可 重 入 版 本 ， 
称 为 gethostbyname ts。 正 确 的 方案 是 使 用 由 互 斥 锁 保护 的 hostent 结构 的 深层 拷贝 

喝 ” 思考 与 练习 题 6.70 不 使 用 共享 变量 改写 badcount.c， 使 其 运行 正确 。 

引 思考 与 练习 题 6.71 编写 程序 thread_file.c, 该 程序 创建 两 个 线程 ,一 个 线程 负责 从 文件 stat.c 
读 入 数据 ， 另 一 个 线程 负责 显示 读 出 的 文件 内 容 。 请 注意 读 文件 线程 如 何 将 文件 结束 标准 传递 
给 显示 线程 。 

喝 ” 思考 与 练习 题 6.72 编写 NxL 与 LxM 矩阵 乘法 子 数 的 并 行 线程 化 版 本 ， 与 顺序 版 本 的 性 能 做 
比较 ， 计 算 在 2 核 CPU 和 4 核 CPU 上 运行 时 的 加 速 比 和 效率 。 

2 * 思 考 与 练习 题 6.73 ”基于 线程 技术 编写 程序 square.c， 计 算 整 型 数组 a[N] 中 各 元 素 的 平方 
和 sum=al*altas*azt+... 二 an*an， 并 测量 CPU 数 为 1、2、4、8、16 时 的 加 速 比 。 
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第 7 章 
进程 间 通 信 


一 般 情况 下 ， 进 程 是 一 个 封闭 实体 ， 分 配给 不 同 进程 的 存储 器 不 重合 、 不 交错 ， 每 个 进程 只 能 
通过 系统 调用 函数 与 操作 系统 交互 ， 进 程 之 间 相 对 独立 ， 互 不 影响 。 但 为 了 合作 完成 一 个 任务 ， 很 
多 进程 之 间 需 要 进行 通信 ， 进 行 数据 传输 ， 甚 至 还 需要 对 相关 活动 进行 协调 。 由 于 同一 计算 机 系统 
上 的 多 个 进程 本 来 就 共享 所 有 系统 资源 , 因此 在 进程 间 进 行 资源 共享 、 数 据 共享 是 顺理成章 的 事情 。 
但 进程 间 通 信 必 须 借助 操作 系统 提供 的 通信 机 制 来 实现 ， 第 5 章 介绍 的 信号 机 制 也 可 算 作 一 种 通信 
机 制 ， 虽 然 能 在 进程 间 传 递 一 些 简单 信号 ， 但 传输 的 信息 量 太 少 ， 只 是 一 种 低级 的 通信 机 制 ， 很 难 
胜任 进程 间 大 量 信息 的 传送 。System V IPC 源 自 System V UNIX， 是 一 种 用 于 进程 间 通 信 的 设施 
(Interprocess Communication)， 包 括 消息 队列 、 共 享 内 存 、 信 号 量 三 种 设施 ， 与 管道 机 制 一 起 ， 构 成 
Linux 进程 间 高 级 通信 机 制 ， 以 支持 进程 间 大 量 数据 的 传送 ， 适 应 不 同 应 用 的 需要 。 本 章 主要 介绍 
管道 和 IPC 进程 间 通 信 机 制 。 


本 章 学 习 目 标 : 

。 理解 利用 PIPE 和 FIFO 实现 进程 间 数 据 通 信 的 原理 ， 掌 握 相应 的 编程 方法 ， 理 解 Linux 管 
道 命令 的 实现 原理 

e 理解 消息 队列 结构 和 通信 和 原理， 掌握 利 用 消息 队列 进行 进程 间 数 据 通信 的 编程 方法 

。 理解 共享 内 存 原理 ， 掌 握 利用 共享 内 存 实现 进程 间 数 据 共享 的 编程 方法 

e 理解 PC 信号 量 API 函数 的 使 用 方法 ， 掌 握 利 用 了 PC 信号 量 实现 进程 同步 与 互 斥 的 编程 方法 


[本 管道 通信 


7.1.1 什么 是 管道 


管道 pipe) 是 一 种 具有 生活 中 “输油管 ”“ 输 水 管 ”特性 的 进程 间 通 信 机 制 ， 管 道 是 由 操作 系统 
内 核实 现 的 。 一 个 进程 从 管道 一 端 写 入 数据 ， 另 一 个 进程 从 管道 另 一 段 读 出 数据 ， 从 而 实现 数据 传 
输 ， 如 图 7-1 所 示 。 


-| 
| | 


图 7-1 管道 好 比 一 根 连接 两 个 进程 的 管子 ， 一 端 压 入 数据 ， 另 一 端 取出 数据 


管道 实际 上 是 操作 系统 内 核 的 一 个 内 存 缓冲 区 ， 但 为 了 简化 管道 操作 ，Linux 在 文件 系统 中 为 
每 个 管道 创建 了 一 个 文件 节点 ， 人 允许 用 户 直接 采用 open、close、read、write 等 UNIX IO 函数 来 读 
写 管 道 ， 这 样 我 们 就 可 以 采用 读 写 文件 的 方法 来 读 写 管 道 ， 给 编程 开发 带 来 极 大 方便 。 

我 们 通常 把 一 个 进程 的 输出 通过 管道 连接 到 另 一 个 进程 的 输入 。 很 多 Linux 用 户 都 熟悉 将 Shell 
命令 连接 在 一 起 的 概念 ， 这 实际 上 就 是 把 一 个 进程 的 输出 传递 给 另 一 个 进程 的 输入 。 对 于 Shell 命 
令 来 说 ， 命 令 的 连接 是 通过 管道 字符 来 完成 的 ， 如 下 所 示 : 

a 


Shell 负责 安排 两 个 命令 的 标准 输入 和 标准 输出 : 

ecnmdl 的 标准 输入 来 自 终 端 键盘 。 

e 将 cmdl 的 标准 输出 传递 给 cmd2， 作 为 cmd2 的 标准 输入 。 

e 将 cmd2 的 标准 输出 连接 到 终端 屏幕 。 

Shell 所 做 的 工作 实际 上 是 对 标准 输入 流 和 标准 输出 流 进行 重新 连接 , 使 数据 流 从 键盘 输入 通过 
两 个 命令 处 理 后 最 终 输出 到 屏幕 上 ， 如 图 7-2 所 示 。 


一 


图 7-2 命令 cmdllcmd2 将 cmdl 的 标准 输出 导入 管道 ， 将 管道 的 输出 作为 cmd2 的 标准 输入 


本 节 讨 论 管道 原理 、 管 道 通信 编程 方法 ， 以 及 如 何 用 管道 将 多 个 进程 连接 起 来 ， 从 而 实现 客户 
端 /服务 器 系统 。 


7.1.2 ”命名 管道 FIFO 及 应 用 编程 


Linux 系统 有 一 种 特殊 的 文件 类 型 ， 称 为 FFO， 即 命名 管道 ， 它 具有 文件 名 、 创 建 时 间 、 访 问 
权限 等 几乎 所 有 的 文件 属性 。 但 管道 文件 中 的 数据 只 存在 于 操作 系统 内 核 的 缓冲 区 内 存 中 ， 不 写 入 
磁盘 块 ， 因 此 管道 文件 在 磁盘 上 是 没有 数据 块 的。 与 通过 磁盘 文件 传递 数据 相 比 ， 两 个 进程 间 通 过 
读 写 FIFO 来 传递 数据 的 速度 快 、 可 靠 性 高 ， 因 为 数据 不 需要 从 内 存 写 入 磁盘 ， 再 从 磁盘 写 入 内 存 。 
FIFO 是 一 种 比较 高 效 可 靠 的 进程 间 通 信 设 施 。 

编写 FIFO 通信 程序 的 方法 非常 简单 ， 首 先 创建 FIFO 文件 ， 然 后 通信 双方 分 别 读 写 FIFO 文件 
就 可 以 了 。 
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1. 创建 FIFO 文件 


命名 管道 可 以 在 命令 行 上 创建 ， 也 可 以 在 程序 中 创建 。 命 令 行 上 用 来 创建 命名 管道 的 命令 是 
mkfifo， 下 面 是 一 个 示例 : 

SmAfifo Amp/myfifol 

SR AF Amp/myfifol 

PIW-r--I— 1 can can 0 2015-12-26 19:51 /tmp/fifol| 

输出 结果 中 的 第 一 个 字符 为 p， 表 示 这 是 一 个 管道 。 最 后 的 | 符号 是 由 1s 命令 的 - 选项 添加 的 ， 
它 也 表示 这 是 一 个 管道 。 

在 程序 中 ， 创 建 命名 管道 的 函数 是 : 

#include <sys/types.h> 

#include <sys/stat.h> 

int mkfifo(const char *filename ,mode tmode); 

返回 值 ， 若 成 功 ， 则 返回 0， 否 则 返回 -1， 错 误 原 因 存 储 于 ermo 中 。 
其 中 ，filename 是 FIFO 文件 路 径 ，mode 是 文件 读 写 权 限 。 
下 面 的 示例 程序 fifol.c 在 目录 /tmp 下 创建 了 一 个 FIFO 文件 ， 文 件 名 为 myfifo: 
话 fifol.c 源 代码 */ 
1 #include "wrapper.h" 


2 intmain0 
3 

4 intres= mkfifo("/tmp/myfifo" , 0777) ; 
5 f(res—0) printf ("FIFO created\n") ; 
6 exit(EXIT SUCCESS): 

fi } 


编译 执行 该 程序 并 检查 FIFO 文件 有 无 创建 : 


S$Sgcec -0 Jol Jolec 
$fo1 
FIFO created 


S$6 -IF Amp/myffo 
PIWXI-XI-x 1 can can 0 2015-12-26 20:00 /tmp/myfifo| 


2. 使 用 命令 访问 FIFO 

命名 管道 FIFO 有 一 个 非常 有 用 的 特性 : 像 普通 文件 一 样 , 既 可 存在 于 文件 系统 中 , 也 可 用 Linux 
命令 对 其 进行 操作 。 在 下 面 的 示例 中 ， 我 们 打开 两 个 终端 ， 终 端 1 执行 mkfifo /tmp/my_fifo 以 创建 
FIFO， 并 尝试 读 这 个 空 的 管道 cat </tmp/my_fifo; 终端 2 尝试 向 FIFO 写 数据 echo "Hello World "> 
/tmp/myfifo。 


终端 1: 终端 2: 
S miffo /mp/myffo 
Rs Deut Mm no RRS ed, ed Tp a 
和 
Hello World 


我 们 可 以 看 到 cat 命令 产生 的 输出 。 如 果 不 向 FIFO 发 送 任何 数据 ，cat 命令 将 一 直 挂 起 ， 因 为 
只 有 两 个 命令 都 连 到 FIFO， 它 们 之 间 才 真正 建立 起 管道 。 当 然 也 可 键入 Cal+C 来 中 断 一 个 等 待 另 
一 端 打开 管道 的 进程 。 

3. 不 同 程序 使 用 FIFO 进行 通信 

下 面 的 示例 程序 利用 前 面 创建 的 FIFO 管道 /ump/myfifo 实现 进程 间 通 信 。 其 中 ，fifowrite.c 将 命 
令 行 参数 argv[1] 的 值 写 入 /tmp/myfifo，fiforead.c 从 /tmp/myfifo 读 出 数据 并 显示 出 来 。 


语 fifowritec 源 代码 */ 
#include "wrapper.h" 
int main(int argc.char* argv[]) 


1 
2 
3 
4 
5 
6 
学 
8 
9 


10 
11 


人 #fiforeadc 源 代码 *#/ 
#include “wrapper.h" 
int main(int argc.char*# argv[]) 


14 


{ 


二 


{ 


} 


int pipe_fd; 

iflarge (=2){ 上 # 启动 方式 为 fifowrite < 待 发 送信 息 > */ 
Printf("need a stringm 
exit(1):; 

} 


printf("Process %d opening FIFO O_ WRONLY\n", getpidO): 
pipe_fd = open("/tmp/myfifo",O_ WRONLY,0); 
printf("Process %d result %d\n", getpidO.pipe_fd): 


write(pipe_fd,argv[1],strlen(argv[1])+1); 
Close(pipe_fd); 
Tetum 0; 


int pipe_fd: 
char info[128] = {0}: 


Printf("Process %d opening FIFO O_RDONLY\n", getpidO): 
Pipe_fd= open("/tmp/myfifo",O_ RDONLY,0); 
printft"Process %d result %d\n". getpidO.pipe_fd):; 


read(pipe_fd,info,sizeof(info)); 
Printf("%s\n",info): 
Close(pipe_fd); 

Tetum 0: 


现在 编译 这 两 个 程序 : 
Sgcec -0 fifowrite fifowritec -L. -Iwrapper 
Sgcec -0 fiforead fiforeadc -L. wrapper 


然后 分 别 在 两 个 终端 执行 它们 。 
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终端 1: 


S$ ffowrite "hello world™” 
Process 13277 opening FIFO O_WRONLY 
Process 13277 result 3 


终端 2: 

$fiforead 

Process 13313 opening FIFO O_ RDONLY 
Process 13313 result 3 

hello world 


读者 还 会 发 现 ,不 管 先 执行 fifowrite 还 是 先 执行 fiforead, 进程 在 显示 第 一 行 “Process xxx opening 
FIFO xxx” 后 都 会 阻塞 ， 直 到 另 一 个 程序 启动 后 ， 先 启动 的 程序 才 会 往 下 执行 。 这 个 事实 表明 ， 两 
个 FIFO 读 写 进程 会 在 open 函数 处 同步 ， 因 为 只 有 FIFO 两 端 同时 连带 进程 ， 管 道 才 算 建 立 。 当 然 ， 
这 是 仅 用 O_RDONLY 或 OWRONLY 标志 打开 FIFO 的 open 执行 方式 。 

管道 机 制 一 般 适合 于 进程 间 单 向 通信 ， 如 果 两 个 进程 A、B 需要 双向 同时 进行 通信 ， 可 创建 两 
个 管道 来 实现 ， 一 个 用 于 A>B 通信 ， 另 一 个 用 于 B>A 通信 。 
2 思考 与 练习 题 7.1 下 面 是 进程 A、B 通过 FIFO 通信 的 代码 ， 请 写 出 进程 B 的 输出 。 


进程 A: 

#include <stdio.h> 

#include <unistd h> 

#include <fentl h> 

int main() 

{ 
int fd; 
fd=open("fifo1",O_WRONLY.0): 
write(fd,"ABCDEFGH” .8); 
write(fd,"1234",6); 


close(fd): 


*7.1.3 利用 FIFO 传输 任意 类 型 数据 
任何 数据 结构 都 存在 于 某 个 内 存 块 中 ， 可 将 该 内 存 块 看 成 write、read 函数 调用 的 缓冲 


通过 FIFO 将 任何 数据 结构 传递 给 其 他 进程 。 


进程 B: 

#include <stdioh> 

#include <unistdh> 

#include <fentl.h> 

intmain0 

{ intfdn:; 
char buff1024]: 
fd=open("fifo1",0_RDONLY.0): 
nread(fd.buf.4); buf[4]=0; 
printf("%d:%s\n" nbuf): 


n=read(fd.buf.20); 
Pprintf("%d:%s\n" nbuf): 
close(fd): 


区 
二 
El 


假设 我 们 要 传递 一 个 类 型 为 工 的 变量 var， 定 义 为 T var。 现 在 要 将 其 通过 命名 管道 “myfifo” 
从 进程 A 发 送 给 进程 B 处 理 。 方 法 就 是 把 变量 var 所 在 单元 看 成 一 个 缓冲 区 ， 其 地 址 为 &var， 长 度 


为 sizeof(T)。 进 程 A、B 的 代码 框架 如 下 。 
进程 A: 


T var 

<< 初 始 化 变量 var>> 
fd=open("myfifo". O_WRONLY.0): 
write(fd.(void*)(&var). sizeof(T)): 
close(fd): 


进程 B: 

intmain0 

{ 
T var 
fd=open("myfifo". O_ RDONLY.0): 
read(fd.(void*\(&var). sizeof(T)): 
<< 处 理 变量 var>> 
close(fd): 
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如 果 要 编程 发 送 一 个 数组 am( 定 义 为 T ar[N]D)， 可 以 每 次 读 写 一 个 数组 元 素 ， 或 将 整个 数组 作 
为 整体 进行 发 送 。 但 如 果 一 个 数组 所 在 存储 块 太 大 ， 也 可 将 这 个 存储 块 划分 成 很 多 分 片 ， 每 次 发 送 
一 个 分 片 ， 分 片 大 小 可 以 取 FIFO 缓冲 区 大 小 。FIFO 缓冲 区 大 小 在 系统 头 文件 limitsh 中 定义 ,一 
般 为 4096B， 用 宏 BUFFER_SIZE 表示 。 
叮 ” 思考 与 练习 题 7.2 下 面 是 进程 A、B 通过 FIFO 通信 的 代码 ， 请 写 出 进程 了 的 输出 。 


进程 A: 进程 B: 

#include <stdio.h> #include <stdioh> 

#include <unistd h> #include <unistd h> 

#include <fentlh> #include <fentLh> 

int main() intmain0 

{intfdni: 
int fd; char buff1024]: 
int a[={10.20.30.40}: int *p=buf: 
fd-open("fifo1",0_WRONLY.0): fd=open("fifo1".O RDONLY.0); 
write(fd,(void*)a, 12); Tread(fd.buf,1024): 
write(fd,(void *)a[2],4); Pprintf("numbers=%d\n",n/4); 

for (1=0; i<n/4: i++) 

close(fd): Printfl"%d “p[); 

} Close(fd); 


7.1.4 无 名 管道 PIPE 及 应 用 

虽然 命名 管道 已 经 是 一 种 比较 方便 易 用 的 管道 了 ， 但 对 父子 进程 来 说 ， 由 于 子 进程 可 以 直接 继 
承 父 进程 拥有 的 打开 文件 描述 符 等 进程 资源 ， 在 父子 进程 间 采 用 管道 机 制 通信 时 ， 甚 至 连 文件 名 都 
可 以 省 略 ， 使 进程 间 通 信 程 序 得 到 进一步 简化 ， 甚 至 还 可 实现 更 强 的 应 用 功能 。 这 种 管道 称 为 无 名 
管道 。 

1. 创建 无 名 管道 


无 名 管道 用 pipe 函数 创建 : 

#include <unistd h> 

intpipe(int fds[2]); 

pipe 函数 的 参数 是 一 个 由 两 个 整数 类 型 的 文件 描述 符 组 成 的 数组 名 。 该 函数 在 数组 中 填 入 两 个 
新 的 文件 描述 符 ， 然 后 返回 0。 如 果 失 败 ， 则 返回 - 1 并 设置 ermo 来 表明 失败 的 原因 。 

返回 的 两 个 文件 描述 符 中 ，fds[1] 是 管道 的 写 端 ，fds[0] 是 管道 的 读 端 。 写 到 fds[1] 的 所 有 数据 都 
可 以 从 fds[0] 读 出 来 ,数据 基于 先进 先 出 的 原则 进行 处 理 ,这 意味 着 如 果 把 字 节 值 1"\'2'、'3' 写 到 fds[1]， 
从 fds[0] 读 到 的 数据 也 会 是 1'、'2'、'3'。 这 与 栈 的 处 理 方式 不 同 ， 栈 采用 后 进 先 出 的 原则 ， 通 常 简写 
为 LIFO。 

需要 注意 ,这 里 使 用 的 是 文件 描述 符 而 不 是 文件 流 指针 ， 所 以 必须 用 底层 IO 函数 read 和 write 
来 访问 数据 ， 而 不 是 用 文件 流 库 函 数 fread 和 fwrite。 由 前 面 章节 的 相关 知识 可 知 ，read 和 write 函 
数 读 写 的 数据 是 一 个 内 存 块 ， 其 中 的 内 容 可 以 是 任何 数据 类 型 ， 包 括 各 种 变量 、 数 组 、 结 构 体 等 ， 
写 入 管道 时 只 需要 将 这 些 变量 、 数 组 、 结 构 体 转换 成 (void*) 指 针 ， 并 将 从 管道 读 出 到 缓冲 区 的 数据 
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看 成 对 应 的 数据 类 型 即 可 ， 稍 后 会 有 一 个 示例 程序 来 演示 如 何 通过 管道 传输 结构 体 。 
下 面 的 示例 程序 pipel.c 用 pipe 函数 创建 一 个 无 名 管道 ， 并 且 自 己 给 自己 发 送 数据 ， 以 验证 管 


道 是 否 正常 工作 。 


入 pipel.c 源 代码 ， 进 程 通过 pipe 函数 自己 给 自己 发 送 数据 */ 
1 #include "wrapper h" 

4 intmain0 

3 { 

4 intcount 

5 int fds[2]: 

6 const char some data[] ="1234567890"; 

char buffer[BUFSIZ + 1]: 

8 memset(buffer, \0', sizeof(buffer)): 

9 

10 Pipe(fds) : 

11 count= write(fds [1], (void*)some_data, strlen(some_data)): 
1 printft"Wrote %d bytes\n", count): 

13 

14 count =read(fds [0].(void*) buffer, BUFSIZ): 

15 printf("read %d bytes: %s\n", count buffer); 

16 exit(EXIT_SUCCESS): 

I } 


这 个 程序 的 第 10 行 以 数组 fds 为 参数 创建 一 个 管道 , 第 11 行 用 文件 描述 符 fds[1] 向 管道 中 写 数 
据 ， 第 14 行 从 fds[0] 读 回 数据 ， 第 15 行 打印 通过 管道 传输 的 数据 。 这 里 将 字符 数组 some_data 和 
buffer 转换 为 void* 类 型 ， 分 别 作为 发 送 数据 和 接收 数据 的 缓冲 区 。 下 面 编译 执行 该 程序 ， 


$8cce pipele -0 pipel -L. -wrapper 
$ /pipel 

Wrote 10 bytes 

read 10 bytes: 1234567890 


2. 父子 进程 间 利用 无 名 管道 进行 通信 


当 程序 用 fork 调用 创建 新 的 进程 时 ， 原 先 打开 的 文件 描述 符 仍 将 保持 打开 状态 ， 并 可 由 子 进程 
继承 使 用 。 如 果 在 原先 的 进程 中 创建 一 个 管道 ， 然 后 调用 fork 创建 新 的 进程 ， 我 们 便 可 通过 管道 在 


两 个 进程 之 间 传递 数据 。 


pipe2.c 是 一 个 示例 程序 , 它 创建 一 个 子 进程 , 父 进程 通过 无 名 管道 将 一 个 学 生 信息 结构 体 grade 
传递 给 子 进程 输出 显示 ， 该 结构 体 包括 学 号 、 姓 名 、 语 文 、 数 学 、 英 语 五 个 字段 ， 前 两 个 字段 为 字 


符 串 型 ， 后 三 个 字段 为 浮 点 型 。 


让 pipe2.c 源 代码 ， 利 用 无 名 管道 在 父子 进程 间 传 递 数据 */ 


1 #include "wrapper h" 

2 struct grade { 

3 char sno[20]: 户 学 号 所 
4 char name[10]: 刻 姓 名 
上 float chinese: A 
6 float math: 仿 数 学 所 
8 float english: 入 英语 所 
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} 
ee 


int count: 

int fds[2]: 

char buffer[BUFSIZ + 1]: 

pid tpid: 

struct grade grad={"201441401123"" 李 向 阳 ".89.1.70.80}: 


iflpid—0) { 店 子 进程 */ 
close(fds[1D): 
count= read(fds[0], buf. BUFSIZ): 
printf("read %d bytes:\n 学 号 =%s\n 姓名 =96s\n 语文 =963.1fn 
数学 =9%3.1fn 英语 =9%3.1fn", countp->sno, p->name, 
Pp->chinese, p->math, p->english); 
close(fds[OD): 
exit(EXIT_ SUCCESS): 
} 
else { 店 父 进程 4/ 
close(fds[0]): 
count = write(fds[1],(void*)&grad.sizeoftstruct grade)): 
printf("Wrote %d bytes\n", count): 
close(fds[1]): 
exit(EXIT_ SUCCESS): 


在 第 15 行 ， 父 进程 对 要 传送 的 成 绩 记录 进行 初始 化 ， 第 17 行 创建 无 名 管道 ， 返 回 fds[0] 为 管 
道 读 端 、fds[1] 为 管道 写 端 。 第 18 行 创建 子 进程 。 由 于 父 进程 的 打开 文件 和 文件 描述 符 会 全 部 由 子 
进程 继承 使 用 ， 因 此 父子 进程 都 可 以 通过 fds[0]、fds[1] 读 写 管 道 。 但 子 进程 不 需要 写 管道 ， 父 进程 


本 


不 需要 


道 ， 因 此 子 进程 在 第 20 行 关 闭 管道 写 端 fds[1]， 父 进程 在 第 29 行 关闭 管道 读 端 fds[0]。 


这 是 一 种 良好 的 编程 习惯 ， 图 7-3 是 父子 进程 利用 管道 进行 通信 的 示意 图 。 


子 进程 〈 读 ) 
fds[0] fds[1] 


图 7-3 ”父子 进程 利用 管道 进行 通信 


父 进程 ( 写 ) 
,fds[O] fds[1] 


接 下 来 ， 父 进程 在 第 30 行将 整个 grad 记录 写 入 管道 , 子 进程 在 第 21 行将 该 记录 从 管道 读 出 到 
缓冲 区 buf， 该 缓冲 区 的 大 小 必须 不 小 于 grad 记录 的 大 小 ， 以 保证 所 读 出 数据 的 完整 性 ， 但 实际 读 
出 的 字 节 数 不 会 超过 写 入 的 字 节 数 。 最 后 子 进程 在 第 22~24 行 把 缓冲 区 buf 看 成 一 个 struct grade* 类 
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型 的 指针 p， 通 过 指针 变量 p 输出 读 到 的 成 绩 记录 。 

现在 编译 执行 程序 : 

Sgcc pipe2.c -0 pie2 -TL -Iwrapper 

$ /pipe2 

Wrote 44 bytes 

can@ubuntu:~/workS$ read 44 bytes: 

学 号 =201441401123 

姓名 = 李向阳 

语文 =89.1 

数学 =70.0 

英语 =80.0 

上 述 输出 结果 中 第 3 行 显示 的 “can@ubuntu:~/work$” 是 父 进 程 结束 打印 的 命令 提示 符 ， 由 于 
此 时 子 进程 尚未 结束 ， 从 管道 读 出 的 信息 显示 在 该 行 之 后 。 
呵 ” 思考 与 练习 题 7.3 ”修改 上 述 程序 ， 实 现 子 进程 向 父 进程 发 送 数据 “1234567890” 和 结构 体 
变量 grad 的 值 ， 父 进程 将 收 到 的 信息 显示 出 来 。 


7.1.5 使 用 PIPE 实现 管道 命令 


无 名 管道 PIPE 的 用 处 非常 大 ， 除 作为 普通 的 文件 描述 符 使 用 外 ， 还 可 在 不 修改 进程 代码 的 情 
况 下 ， 通 过 调用 dup 函数 将 标准 输入 、 标 准 输出 重 定向 到 无 名 管道 ， 实 现 父 子 进程 、 子 进程 与 子 进 
程 间 的 管道 通信 功能 ，Linux Shell 的 管道 命令 “|” 实际 上 就 是 通过 PIPE 技术 来 实现 的 。 

pipe3.c 是 一 个 示例 程序 ， 父 子 进程 通过 管道 连接 ， 父 进程 将 字符 串 “1234567890” 传 递 给 子 进 
程 处 理 ， 子 进程 执行 od 命令 ， 对 收 到 的 文本 进行 计数 处 理 。pipe3.c 调用 dup 函数 ， 使 子 进程 的 输 
入 和 父 进程 的 输出 通过 管道 连接 起 来 ， 进 行 数据 传输 。 


入 pip3.c， 利 用 无 名 管道 实现 管道 功能 */ 
#include "wrapper.h" 
2 int main() 
3 
4 int countpid: 
5 int fds[2]: 
6 const char some_data[] = "1234567890"; 
可 char buffer{[BUFSIZ + 1]: 
8 memset(buffer. \0', sizeof(buffer)): 
9 Pipe(fds): 
10 
11 pid-forkO: 
12 这 pid 一 0) { 
13 close(0): 
14 dup(fds[0]): 
15 close(fds[0]): 
16 close(fds[1D): 
17 execlp("od" . "od"."-c" , (char *)0) ; 
18 exit( EXIT FAILURE): 
19 3 
20 else{ 


281 


21 close(fds[OD): 
2 count write(fds[1], some_data, strlen(some_data)); 
23 close(fds[1]):; 

24 printft"Wrote %ed bytes\n", counb: 

25 exit(EXIT SUCCESS): 

26 

27 } 


该 程序 在 第 9 行 创建 一 个 管道 ， 图 7-4 是 调用 pipe 函数 之 后 的 情况 。 第 11 行 调用 fork 函数 创 

建 一 个 子 进程 ， 子 进程 获得 父 进程 管道 文件 描述 符 的 副本 。 此 时 ， 父 子 进程 都 拥有 访问 管道 的 文件 

描述 符 ， 一 个 用 于 读数 据 ， 另 一 个 用 于 写 数据 ， 所 以 总 共有 4 个 打开 的 文件 描述 符 ， 如 图 7-5 所 示 。 
管道 


进程 ) 一 


7-4 调用 pipe 函数 之 后 的 情况 ， 有 两 个 读 写 管道 的 文件 描述 符 


file_pipes[0] file_pipes[0] 


一 IC 
号 写 


file_pipe[1] file_pipe[1] 
7-5 调用 fork 函数 之 后 的 管道 情况 ， 有 4 个 文件 描述 符 ， 父 子 进程 各 两 个 


然后 ， 子 进程 在 第 13 行 先 用 close(0) 关 闭 标准 和 输入， 再 在 第 14 行 调 用 dup(fds[0]) 把 与 管道 读 端 
关联 的 文件 描述 符 复制 为 文件 描述 符 0， 现 在 其 标准 输入 就 是 管道 。 由 于 管道 读 端的 文件 描述 符 已 
经 复制 到 文件 描述 符 0， 对 于 子 进程 来 说 ， 两 个 管道 文件 描述 符 都 没有 用 了 ， 因 此 第 15 和 第 16 行 
将 它们 关闭 。 图 7-6 是 程序 做 好 数据 传输 准备 后 的 情况 ， 子 进程 的 标准 输入 已 关联 到 管道 读 端 。 


标准 输出 
一 一 一 
图 7-6 程序 做 好 数据 传输 准备 后 的 管道 情况 


接 下 来 子 进程 就 可 以 用 exec 来 启动 od 命令 ,od 命令 从 标准 输入 读 到 的 信息 实际 上 来 自 于 管道 。 
od 命令 将 等 待 数据 的 到 来 ， 就 好 像 等待 来 自用 户 终端 的 输入 一 样 。 事实 上 ， 如 果 没 有 明确 使 用 检测 
这 两 者 之 间 差 别 的 特殊 代码 ， 那 么 od 命令 并 不 知道 输入 来 自 管道 ， 而 不 是 来 自 终端 。 

父 进程 在 第 21 行 首先 关闭 管道 的 读 端 fds[0]， 因 为 它 不 会 从 管道 读 取 数据 。 接 着 ， 在 第 22 行 
向 管道 写 入 数据 。 当 所 有 数据 都 写 完 后 ， 父 进程 关闭 管道 的 写 端 并 退出 。 因 为 现在 已 没有 打开 的 文 
件 描述 符 可 以 向 管道 写 数据 了 ，od 命令 读 取 到 管道 中 的 10 字 节 数据 后 ， 后 续 的 读 操作 将 返回 0 字 
节 ， 表 示 已 到 达 文 件 未 尾 。 当 读 操作 返回 0 时 ，od 命令 就 退出 运行 。 这 类 似 于 在 终端 运行 od 命令 ， 
然后 按 下 CuHD 发 送 文件 末尾 标志 。 
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下 面 编译 执行 程序 : 

Sgccpipe3.c -0 pipe3 -L. -Wwrapper 

S$ /pipe3 

Wirote 10 bytes 

0000000 1 2 3 4 5 6 7 8 9 0 
0000012 


有 时 ， 我 们 希望 通过 创建 管道 将 两 个 子 进程 连接 起 来 ， 两 个 子 进程 需要 调用 exec 来 运行 Linux 
命令 。 这 个 功能 可 以 这 样 来 实现 : 父 进程 创建 无 名 管道 后 ， 先 创建 两 个 子 进程 ， 再 让 子 进程 调用 dup 
函数 ， 将 标准 输入 或 标准 输出 重 定向 到 无 名 管道 来 进行 通信 ，UNIX Shell 的 管道 命令 就 可 通过 这 种 
方式 来 实现 。 

叮 ” 思考 与 练习 题 7.4 请 编写 程序 ， 创 建 两 个 子 进 程 ， 各 执行 一 条 命令 ， 两 个 子 进程 通过 管道 通 
信 ， 即 实现 类 似 于 “ps -aux | grep init” 的 功能 。 


*7.1.6 使 用 FIFO 的 客户 端 /服务 器 应 用 程序 


作为 学 习 FIFO 的 最 后 一 部 分 内 容 ， 我 们 考虑 怎样 通过 命名 管道 来 编写 一 个 简单 的 客户 端 /服务 
器 应 用 程序 : 客户 端 进程 发 送 请 求 ， 服 务 器 进程 接收 请 求 ， 对 它们 进行 处 理 ， 将 字母 转换 为 大 写 ， 
并 把 结果 数据 返回 给 发 送 请 求 的 客户 端 。 

我 们 希望 允许 多 个 客户 端 进程 向 服务 器 进程 发 送 数据 。 为 了 使 问题 简单 化 ， 假 设 要 处 理 的 数据 
可 以 被 拆 分 为 多 个 数据 块 ， 每 个 数据 块 的 长 度 都 小 子 PIPE_BUF 字 节 。 
因为 服务 器 每 次 只 能 处 理 一 个 数据 块 ， 所 以 只 使 用 一 个 FIFO 应 该 是 合理 的 ， 服 务 器 通过 它 读 
取 数据 ， 每 个 客户 端 向 它 写 入 数据 。 这 个 FIFO 取 名 为 serv_fifo。 只 要 将 FIFO 以 阻塞 模式 打开 ， 服 
务 器 和 客户 端 就 会 根据 需要 自动 被 阻塞 。 

将 处 理 后 的 数据 返回 给 客户 端 稍微 有 些 麻 烦 。 我 们 需要 为 每 个 客户 端 设 置 一 个 专用 管道 来 传送 
返回 的 数据 。 通 过 在 传递 给 服务 器 的 数据 中 加 上 客户 端的 进程 标识 符 (PID) 来 命名 管道 文件 ， 在 这 里 
我 们 设计 成 ci_<PID> fifo。 

(1) 首先 ， 我 们 创建 一 个 头 文件 clienth， 用 于 定义 客户 端 和 服务 器 程序 都 会 用 到 的 数据 。 为 了 
方便 使 用 ， 它 还 包含 必要 的 系统 头 文件 。 


#include <sys/stath> 

#define SERVER_FIFO_NAME "tmp/serv_fifo" 证 服务 器 通过 serv_fifo 接收 信息 */ 

#define CLIENT_FIFO_NAME "/tmp/cli_%d fifo" 上 # 第 1、2... 个 客户 端 分 别 通过 */ 
上 访 管道 ch_1、cli_2... 接 收 信息 所 

#define BUFFER_SIZE 20 


struct data to_pass st { 上 # 客户 端 发 来 数据 的 结构 */ 
pid t pid: 上 旋 进程 PDD 机 
char ”some data[BUFFER_SIZE - 1]: 此 存放 消息 的 用 户 缓冲 区 */ 


下 
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(2) 现在 编写 服务 器 程序 server.c。 在 这 一 部 分 ， 我 们 创建 并 打开 服务 器 管道 ， 它 被 设置 为 只 读 
的 阻塞 模式 。 稍 作 休息 (这 是 出 于 演示 目的 ) 之 后 ， 服 务 器 开始 读 取 客 户 端 发 送 来 的 数据 ， 这 些 数 据 
采用 的 是 data_to_pass_st 结构 。 


#include "client h" 
#include <ctypeh> 


intmain0 

{ 
int server_fifo fd, client fifo fd: 
struct data_to_pass_stmy_data; 
int read res: 
char client_fifo[256]; 
char *tmp_char_ptr: 


mkfifo(SERVER_FIFO_ NAME, 0777): 
server fifo fd=open(SERVER FIFO NAME.O_ RDONLY.0): 
sleep(10); 
while(D) { 
Tead res = read(server fifo fd, &my_data, sizeoftmy_data)):; 


(3) 在 接 下 来 的 这 一 部 分 ， 对 刚 从 客户 端 那里 读 到 的 数据 进行 处 理 ， 把 my_data 中 的 所 有 字符 
全 部 转换 为 大 写 ， 并 且 把 CLIENT FIFO_ NAME 和 接收 到 的 client pid 结合 在 一 起 。 

tmp_char ptr=my_data.some_data; 

while (*tmp_char ptr) { 


*tmp_char_ptr = toupper(*tmp_char_ptr); 
tmp_char ptrt+t; 


} 
sprintftclient_fifo, CLIENT_FIFO_ NAME, my_data.client_pid); 


(4) 然后 ， 以 只 写 的 阻塞 模式 打开 客户 端 管道 ， 把 经 过 处 理 的 数据 发 送 回去 。 最 后 ， 关 闭 服务 
器 管道 的 文件 描述 符 ， 删 除 FIFO 文件 ， 退 出 程序 。 


这 read_res>0) { 
client fifo fd=open(client fifo.O_WRONLY.0): 
my_data.pid=getpidO; 
write(client fifo fd, &my_data, sizeoftmy_data)): 
close(client fifo fd):; 
} 
} 
close(server fifo fd):; 
unlink(SERVER FIFO_NAME): 
exit(EXIT_SUCCESS): 
} 


(5) 下 面 是 客户 端 程序 clientc。 这 个 程序 的 第 一 部 分 先 检查 服务 器 FIFO 文件 是 否 存 在 。 如 果 存 
在 ， 就 打开 它 。 然 后 获取 自己 的 进程 DD， 该 进程 D 构成 要 发 送 给 服务 器 的 数据 的 一 部 分 。 接 下 来 ， 
创建 客户 FIFO， 为 下 一 部 分 工作 做 好 准备 。 


#include "client.h" 
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#include <ctypeh> 

int main() 
int server fifo fd, client fifo fd: 
struct data to_pass_stmy _data: 
int 宇 
char client fifo[256]: 


Server fifo fd=open(SERVER FIFO NAME.O_WRONLY.0): 


my_data.pid = getpidO:; 
sprintflclient fifo, CLIENT FIFO NAME, my _datapid): 
mkfifo(client_ fifo, 0777); 库 创建 客户 FIFO*/ 


(6) 这 部 分 有 5 次 循环 ， 在 每 次 循环 中 ， 客 户 端 将 数据 发 送 给 服务 器 ,然后 打开 客户 端 FIFO( 只 
读 ， 阻 塞 模式 ) 并 读 回 数据 。 在 程序 的 最 后 ， 关 闭 服务 器 FIFO 并 调用 unlink 函数 ， 将 客户 端 FIFO 
从 文件 系统 中 删除 。 


forG=0i<5:iD) { 
strepy(my_data.some_data, "Hello"); 
my_data.pid = getpidO: 
Printf("%s from %d:", my_data.some_data, my_data.pid); 
write(server_fifo fd, &my_data, sizeof(my_data)): 


client fifo fd= open(client fifo,O_ RDONLY.0): 
read(client fifo fd, &my_data, sizeof(my_data)); 
printf("received %s from %d \n", my_data.some_data, my_data.pid); 
close(client fifo fd); 

} 

close(server_fifo fd: 

unlink(client_fifo); 

exit(EXIT_SUCCESS): 

} 


这 两 个 程序 的 编译 命令 是 : 
S$gcc -0 server sererc -L. -Iwrapper 
S$gcc -0 client clientc -L. -Mwrapper 
测试 时 ， 需 要 运行 一 个 服务 器 程序 和 多 个 客户 端 程序 。 为 了 让 多 个 客户 端 程序 尽 可 能 在 同一 时 
间 启动 ， 在 Shell 终端 窗口 中 执行 一 个 Shell for 循环 ， 在 循环 中 启动 客户 端 进 程 : 
$ /server & 
Sforiin12345 
do 


client & 
done 


上 述 命 令 启 动 1 个 服务 器 进程 和 5 个 客户 端 进程 。 客 户 端的 输出 如 下 所 示 : 


Hello from 5292:received HELLO from 5291 
Hello from 5296:received HELLO from 5291 
Hello from 5294:received HELLO from 5291 
Hello from 5293:received HELLO from 5291 
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Hello from 5295:received HELLO from 5291 

如 上 所 示 ， 不 同 的 客户 端 输出 交错 在 一 起 ， 但 每 个 客户 端 都 获得 了 服务 器 返回 的 正确 数据 。 由 
于 客户 端 请 求 的 交错 顺序 是 随机 的 ， 因 此 服务 器 接收 到 的 客户 端 请 求 顺序 也 会 呈现 随机 特点 ， 而 且 
每 次 运行 情况 都 可 能 不 同 。 

现在 解释 客户 端 和 服务 器 的 交互 过 程 。 服 务 器 以 只 读 模式 创建 FIFO 后 便 被 阻塞 ， 直 到 第 一 个 
客户 端 以 写 方式 打开 该 FIFO 建立 连接 为 止 。 这 使 服务 器 进程 解除 阻塞 并 执行 sleep 语句 ， 让 来 自 客 
户 端的 数据 排队 等 候 。 在 实际 的 应 用 程序 中 ， 应 该 把 sleep 语句 删除 。 我 们 在 这 里 使 用 它 只 是 为 了 
演示 有 多 个 客户 端的 请 求 同 时 到 达 的 场景 。 

与 此 同时 ， 客 户 端 打开 服务 器 FIFO 后 , 创建 自己 其 唯一 的 命名 管道 FIFO 来 读 取 服 务 器 返回 的 
数据 。 之 后 ， 发 送 数据 给 服务 器 ， 然 后 被 阻塞 在 对 其 FIFO 的 read 调用 上 ， 等 待 服务 器 的 响应 。 

接收 到 来 自 客户 端的 数据 后 ， 服 务 器 处 理 它们 ， 然 后 以 只 写 方式 打开 客户 端 FIFO 并 将 处 理 后 
的 数据 返回 ， 这 将 解除 客户 端的 阻塞 状态 。 客 户 端 被 解除 阻塞 后 ， 即 可 从 自己 的 管道 中 读 取 服务 器 
返回 的 数据 。 

整个 处 理 过 程 不 断 重复 ， 直 到 最 后 一 个 客户 端 关闭 服务 器 管道 为 止 ， 这 将 使 服务 器 的 read 调用 
失败 (返回 0， 因 为 已 经 没有 进程 以 写 方式 打开 服务 器 管道 了 。 如 果 这 是 一 个 真正 的 服务 器 进程 ， 它 
还 需要 继续 等 待 客户 端 请 求 ， 我 们 需要 对 它 进行 修改 ， 有 两 种 方法 ， 如 下 所 示 : 

。 为 它 自己 的 服务 器 管道 打开 一 个 写 文件 描述 符 ， 这 样 read 调用 将 总 是 阻塞 而 不 是 返回 0， 

` 会 因为 最 后 客户 端 退出 而 终止 。 
@” 当 read 调用 返回 0 时， 关闭 并 重新 打开 服务 器 管道 ,使 服务 器 进程 阻塞 在 open 调用 处 以 等 
待 客户 端 请 求 的 到 来 ， 就 像 它 最 初 启动 时 那样 。 


消息 队列 


消息 队列 提供 了 一 种 在 两 个 不 相关 的 进程 之 间 传递 数据 的 简单 有 效 方法 。 与 命名 管道 相 比 ， 其 
优势 在 于 ， 它 独立 于 发 送 和 接收 进程 而 存在 ， 消 除了 在 同步 命名 管道 的 打开 和 关闭 操作 时 可 能 产生 
的 一 些 麻烦 。 消 息 队列 在 进程 间 以 数据 块 为 单位 传送 数据 ， 每 个 数据 块 都 有 一 个 类 型 标记 ， 接 收 进 
程 可 以 独立 地 接收 含有 不 同类 型 值 的 数据 块 。 除 了 可 以 避免 命名 管道 的 同步 和 阻塞 问题 之 外 ， 还 可 
以 提前 查看 紧急 消息 。 与 管道 一 样 ， 其 不 足 之 处 是 每 个 数据 块 都 有 最 大 长 度 限 制 ， 系 统 中 所 有 队列 
包含 的 全 部 数据 块 的 总 长 度 也 有 上 限 。 

虽然 x/Open 规范 说 明 这 些 限制 是 强制 的 , 但 并 未 提供 发 现 这 些 限制 的 方法 , 只 是 告诉 我 们 超过 
这 些 限制 是 引起 一 些 消息 队列 函数 失败 的 原因 之 一 。Linux 系统 有 两 个 宏 定义 MSGMAX 与 
MSGMNB， 它 们 以 字 节 为 单位 分 别 定义 了 一 条 消息 和 一 个 队列 的 最 大 长 度 。 


7.2.1 消息 队列 的 结构 


System V 消息 队列 是 在 消息 传输 过 程 中 保存 消息 的 容器 , 用 msqid ds 结构 体 记录 其 属性 , 本 质 
上 是 内 核 中 的 一 个 消息 链表 ， 而 消息 是 链表 中 的 一 条 记录 。 消 息 队 列 存在 于 操作 系统 内 核 中 ， 发 送 
进程 把 新 消息 链接 到 队列 末尾 ， 接 收 进程 按 某 种 顺序 每 次 从 队列 中 搞 取 一 条 消息 ， 如 图 7-7 所 示 。 


可 
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lpc_perm) 


7-7 消息 队列 的 结构 


7.2.2 ”消息 队列 函数 
消息 队列 函数 主要 有 msgget、msgsnd、msgrev、msgctl 等 几 个 。 
1. msgget 函数 
我 们 用 msgget 函数 创建 和 访问 消息 队列 : 


#include <sys/msg h> 
int msgget(key_t key, int flag): 


返回 值 ， 成 功 时 msgget 函数 返回 一 个 正 整数 ， 即 队列 标识 符 ， 失 败 时 返回 - 1。 


key: 一 个 整数 类 型 的 键 值 ， 用 来 命名 某 个 特定 的 消息 队列 。 特 殊 键 值 PC_PRIVATE 用 于 创建 
私有 队列 ， 从 理论 上 说 ， 它 应 该 只 能 被 当前 进程 访问 ， 但 消息 队列 在 某 些 Linux 系统 中 事实 上 并 非 
私有 ， 因 此 该 键 值 意义 不 大 。 

flag: 由 9 个 权限 标志 组 成 ， 要 创建 消息 队列 ，msgflg 参数 应 包含 标志 了 PC_CREAT。 如 果 消 息 
队列 已 经 存在 ，IPC_CREAT 标志 将 被 忽略 。 


2. msgsnd 函数 
msgsnd 函数 用 来 把 消息 添加 到 消息 队列 中 : 


#include <sys/msg.h> 


int msgsnd(int msqid const void *msg_ptr, size_tmt_sz. int flag): 
返回 值 ; 成 功 时 这 个 函数 返回 0， 把 消息 副本 链 入 消息 队列 ， 失 败 时 返回 - 1。 


msqid: 由 msgget 函数 返回 的 消息 队列 标识 符 。 
msg_ptr: 指向 准备 发 送 的 消息 的 指针 ， 消 息 的 前 4 个 字 节 是 一 个 long 型 整数 ， 称 为 消息 类 型 ， 
后 面 是 消息 正文 ， 可 以 用 include/linux/msg.h 中 定义 的 结构 体 来 描述 。 


structmssgbuf { 
long mtype; 上 # 消息 的 类 型 ， 必 须 为 正 数 */ 
char mtext[BUFFER. SIZE]: 上 # 消息 正文 #/ 

> 


BUFFER_SIZE 是 消息 正文 的 最 大 长 度 ， 消 息 正文 的 实际 长 度 由 参数 mt_sz 指定 ， 数 值 范 围 为 
0-BUFFER_SIZE。 
mt sz: mt ptr 消息 正文 的 长 度 ， 不 包括 消息 类 型 字段 的 长 度 。 
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Hag: 控制 消息 队列 满 或 某 些 特殊 情况 下 的 处 理 方法 。 如 果 flag 中 设置 了 IPC NOWAIT 标志 ， 
函数 将 立刻 返回 ， 不 发 送 消息 并 且 返 回 值 为 - 1; 如 果 flag 中 无 PC NOWAIT 标志 ， 则 发 送 进程 挂 
起 以 等 待 队列 中 腾 出 可 用 空间 。 一 般 该 参数 设置 为 0。 


3. msgrcv 函数 
msgrev 函数 从 消息 队列 中 获取 消息 : 


#include <sys/msg h> 

int msgrev(int msqid, void *msg_ptr, size tbuf sz long int msgtype, int flag); 
返回 值 ， 成 功 时 msgrcv 函数 返回 复制 到 接收 缓冲 区 中 的 字 节 数 ， 消 息 被 复制 到 由 msg_ptr 指向 的 
用 户 分 配 的 缓冲 区 ， 并 删除 消息 队列 中 的 对 应 消息 。 失 败 时 返回 -1。 


msqid: 由 msgget 函数 返回 的 消息 队列 标识 符 。 

msg_ptr: 指向 准备 接收 消息 的 缓冲 区 的 指针 。 

bufsz: 消息 缓冲 区 的 大 小 ， 包 括 消息 类 型 部 分 。 

msgtype: 长 整 型 参数 ， 指 定 接收 的 消息 类 型 ， 实 现 一 种 简单 的 接收 优先 级 。 若 为 非 零 值 ， 就 获 
取 类 型 与 之 匹配 的 第 一 条 消息 ; 若 为 0， 则 获取 消息 队列 中 的 第 一 条 消息 。 

flag: 用 于 控制 消息 队列 中 无 指定 类 型 消息 时 的 处 理 方法 。 若 flag 设置 了 IPC_ NOWAIT 标志 ， 
函数 会 立刻 返回 ， 返 回 值 是 - 1; 若 PC NOWAIT 标志 未 被 设置 ， 并 且 无 可 读 消息 ， 则 调用 进程 被 
阻塞 ， 直 到 一 条 相应 类 型 的 消息 到 达 队 列 。 一 般 情况 下 该 参数 设置 为 0， 无 消息 可 读 时 ， 调 用 进程 
被 阻塞 。 


4. msgctl 函数 


msgctl 是 消息 队列 控制 函数 : 


#include <syshmsgh> 
int msgctl(int msqid., int command, struct msqid_ds *buf ): 


返回 值 ， 成 功 时 返回 0， 失 败 时 返回 -1。 如 果 删 除 消息 队列 时 ， 某 个 进程 正在 msgsnd 或 msgrev 函数 中 等 待 ， 
这 两 个 函数 将 失败 。 


msqid: 由 msgget 函数 返回 的 消息 队列 标识 符 。 
command: 消息 队列 的 控制 操作 类 型 ， 可 以 取 3 个 值 。 
e IPC_STAT: 把 消息 队列 相关 属性 读 取 到 msqid_ds 缓冲 区 buf 中 。 
e IPC_SET: 如 果 进 程 拥有 权限 ， 就 用 msqid_ds 结构 体 的 值 设置 消息 队列 。 
。 RMID: 删除 消息 队列 。 
一 般 只 用 到 第 3 个 命令 ， 用 于 在 消息 队列 操作 结束 时 清除 消息 队列 。 其 中 ，msqid_ds 结构 体 至 
少 包含 以 下 成 员 : 
struct msqid ds { 
uid t msg_permuid: 
id t msg perm.gid 
mode_t msg perm mode: 
} 


用 msgsnd 和 msgrcv 两 个 函数 发 送 及 接收 消息 的 基本 原理 ， 如 图 7-8 所 示 。 
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7-8 ”用 msgsnd 和 msgrev 函数 发 送 及 接收 消息 的 基本 原理 


7.2.3 ”消息 队列 通信 示例 

介绍 完 消息 队列 函数 后 ， 我 们 通过 一 个 简单 的 示例 程序 来 看 看 它 的 实际 工作 情况 。 示 例 由 四 个 
程序 组 成 : msgcreate.c 创建 消息 队列 ，msgsnd.c 发 送 消息 ，msgrev.c 接收 消息 ，msgdel.c 清除 消息 
队列 。 

1. 消息 队列 创建 程序 msgcreate.c 


msgcreate.c 创建 一 个 键 值 为 0x12345 的 消息 队列 , 将 消息 队列 的 键 值 作为 命令 行 参数 argv[1] 提 
因此 该 程序 的 运行 方法 为 ./msgcreate 0x12345。 程 序 代 码 如 下 : 


供 


话 msgcreatec 源 代码 */ 
#include “wrapper.h" 
int main(int argc,char * argv[]) { 
int rtn; 
int msqid; 
key_t key: 
if (argc<=1) { 


fprintflstderr." 请 以 /msgcreate <key> 的 形式 运行 给 出 的 消息 队列 键 值 \n"); 
exit(1): 
} 
sscanflargv[1], "%ox",&key); 人 # 将 参数 argv[1] 转 换 成 十 六 进 制 数 */ 
msqid = msgget(key, IPC_ CREAT |0644); 
exit(0): 


下 面 编译 执行 程序 ， 查 看 消息 队列 是 否 创 建成 功 : 


Sgcec -0 msgcreater msgcreatec -L. -wrapper 
S$ /msgcreate Ox12345 


S$ ipcs 
key msqid Owner perms Used-bytes messages 
Ox00012345 98304 can 644 0 0 
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在 最 后 可 以 看 到 键 值 为 0x12345 的 消息 队列 。 
2. 消息 发 送 程序 msgsnd.c 


msgsnd.c 将 通过 命令 行 参数 提供 的 信息 包装 成 类 型 为 1 的 消息 ， 发 送 到 键 值 为 0x12345 的 消息 
队列 ， 命 令 行 参数 argv[1] 为 消息 队列 键 值 ，argv[2] 为 待 发 送 的 消息 。 程 序 代码 为 : 


片 msgsnd.c 源 代码 */ 

1 #include "wrapper.h" 

2 char mbuff1024]: 上 # 定义 1024 字 节 长 的 消息 缓冲 区 */ 
3 int main(int argc,char * argv[]) 

4 { 

5 int rtn; 

6 int msqid: 

7 key_tkey; 

8 这 argc = 3){ 

9 tprintf(stderr," 程 序 启动 方法 为 msgsnd1 < 消息 队列 键 值 >< 待 发 送 消息 >n"); 

10 exit(1); 

11 人 

12 sscanflargv{[1], "%x",&key): 片 将 参数 argv[1] 转 换 成 十 六 进 制 数 */ 
13 msqid = msgget(key,0644): 

14 *((long*)mbuf) = 1: 颇 设置 消息 类 型 */ 

15 memcpy(mbuf+4, argv[2]. sttlen(argv[2]) + 1): /# 复制 消息 正文 */ 

16 rtn = msgsnd(msqid, mbuf strlen(mbuf+4) + 1,0): 

17 Printf("you send a message\"%s\" to msq %d\n", argv[1].msqid): 

18 Tetum 0; 

19 } 


第 2 行 定义 一 个 长 度 为 1024 字 节 的 字符 数组 mbuf 作 为 消息 缓冲 区 ;第 14 行 将 数组 元 素 名 mbuf 
看 成 内 存 块 地 址 , 强制 转换 成 (ong*) 类 型 的 指针 , 同时 将 消息 类 型 1 赋 给 该 指针 指向 的 单元 , 使 mbuf 


的 前 4 个 字 节 为 消息 类 型 1; 第 15 行将 命令 行 参数 argv[2] 指 向 的 消息 正文 字符 串 赋 值 到 消息 缓冲 区 


的 正文 部 分 ; 第 15 和 第 16 行 复制 和 发 送 消 息 ， 消 息 正文 的 长 度 为 命令 行 参数 argv[2] 的 长 度 加 1， 
目的 是 把 字符 串 结束 符 \0' 也 添加 进去 。 

下 面 编译 执行 该 程序 : 

$8gcce -0 msgsnd msgsndc -L -iwrapper 

S$/msgsnd Ox12345 "Hello World" 

you send a message"0x12345" to msq 98304 


3. 消息 接收 程序 msgrcv.c 
msgrev.c 将 打开 以 命令 行 参数 argv[1] 为 键 值 的 消息 队列 , 读 取 其 中 类 型 为 1 的 消息 并 输出 显示 。 


广 msgrevc 源 代码 */ 
#include "wrapper.h" 
typedef stmuct MESSAGE 


1 


2 
3 
4 
5 


{ 


int mtype: 
char mtext[512]: 
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6 } mymsg.*pmymsg: 

yf 

8 int main(int argc.char * argv[]) 
9 

10 intrtn: 

11 int msqid; 

12 key_tkey: 

13 mymsg msginfo: 

14 这 argc =2){ 

15 fprintftstderr," 程 序 启动 方法 为 msgrcv < 消息 队列 键 值 >n"); 
16 exit(1); 

ET } 


18 sscanflarev[1], "9ox",&key); /* 将 参数 argv[]] 转 换 成 十 六 进 制 数 */ 


19 msqid = msgget(key,0644): 


20 rn = msgrev(msqid,(pmymsg)&mseginfo.512,1.,0):; 


21 Printf("%s\n" .msginfo.mtext); 
22 Tetum 0; 
23 } 


第 19 行 打开 消息 队列 ， 第 20 行 从 消息 队列 中 搞 取 一 条 类 型 为 1 的 消息 ， 复 制 到 消息 缓冲 


msginfo 中 ， 第 21 行 打印 消息 正文 。 
下 面 编译 执行 该 程序 : 
S$gcec -0 msgrev msgrevc -L. -Iwrapper 


S$ /msgrey 0x12345 
Hello World 


区 


结果 ，msgrcv 读 出 并 显示 msgsnd 写 入 消息 队列 的 信息 。 
在 实际 应 用 中 ， 一 般 消 息 发 送 和 消息 接收 程序 同时 执行 ， 发 送 方 不 断 将 数据 发 送 到 消息 队列 ， 


接收 方 通过 循环 方式 ， 接 收 消息 进行 处 理 


我 们 还 可 以 注意 到 ， 采 用 消息 队列 通信 方式 ， 实 施 双向 通信 只 需要 一 个 队列 ， 可 通过 消息 类 型 


来 区 分 消息 传递 方向 。 甚 至 多 方 通信 也 可 
程 固定 分 配 一 个 或 多 个 消息 类 型 号 ， 就 可 


4. 删除 消息 队列 msgdel.c 


以 通过 一 个 消息 队列 来 完成 ， 比 如 给 每 一 对 需要 通信 的 进 
区 分 每 条 消息 的 来 源 和 去 向 。 


msgdel.c 删除 用 命令 行 参数 指定 键 值 的 消息 队列 。 


雍 msgdelc 源 代码 */ 
#include "wrapper h" 
int main(int argc.char *+ argv[]) 
{intrtn: 


iflargc—=D) { 


fprintflstderr." 请 以 /msgdel <key> 的 形式 运行 ， 给 出 消息 队列 的 键 值 n"): 


ba 
加 


exit(1): 
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10 
11 sscanfrargv[]]. "96x",&key) 上 将 参数 argv[1] 转 换 成 十 六 进 制 数 */ 
12 msqid = msgget(key.0644): 
13 rtn = msgctl(msqid,IPC_RMID,NULL): 
14 exit(0); 
} 

编译 执行 该 程序 : 
Sgcc -0 msgdel msgdelc -L. -Iwrapper 
Sipes 
key msqid Owner perms used-bytes messages 
Ox00012345 196608 can 644 0 0 

S$ /msgdel Ox12345 

Sipes 


msgdel 程序 执行 后 ， 键 值 为 0x12345 的 消息 队列 已 经 被 删除 。 也 可 以 通过 ipcmm 命令 来 删除 消 
息 队 列 ， 但 需要 用 -q 选项 给 出 消息 队列 的 qid， 上 面 键 值 为 0x12345 的 消息 队列 的 qid 为 196608， 
因此 用 ipcrm 命令 删除 它 的 命令 格式 为 ipcrm -q 196608。 
2 思考 与 练习 题 7.5 下 面 的 进程 A、 进程 B 通 过 消息 队列 通信 ， 请 给 出 进程 B 的 输出 。 


发 送 方 进程 A: 接收 方 进程 B: 

#include "wrapper.h" #include “wrapper.h" 

typedef struct MESSAGE typedef struct MESSAGE 

{ { 
int mtype: int mtype: 
char mtext[512]:; char mtext[512]: 

} mymsg,*pmymsg; } mymsg,*pmymsg; 

int main() intmain0 

1 
int qid: intqidlen: 
mymsg Isg: mymsg msg: 
msgmtype=]1; qid= msgget(123.0644|IPC_CREAT): 
strecpy(msg.mtext,"12345678"); jlen=msgrcv(qid.msg.sizeoftmymsg).1.0): 

printflen=o%odwmmsg=-9%sm"， 

qid=msgget(123.0644IIPC_CREAT): len.msg.mtext); 
msgsnd(qid.msg,strlen(msg.mtext)+1.0): } 


} 
7.2.4 通过 消息 队列 传输 任意 类 型 的 数据 

消息 通信 的 实质 是 把 一 个 内 存 块 的 数据 通过 消息 队列 传递 给 另 一 个 进程 ， 任 何 类 型 的 数据 结 
都 可 通过 消息 队列 进行 传送 。 基 本 方法 是 : 发 送 方 把 待 发 送 的 数据 结构 复制 到 消息 缓冲 区 的 正文 部 
分 ， 发 送出 去 ， 接 收 方 从 所 收 到 消息 的 正文 部 分 把 数据 复制 到 特定 的 数据 结构 中 。 假 定 要 传送 类 型 
为 了 的 变量 var， 定 义 为 T var， 消 息 缓冲 区 是 一 个 地 址 为 buf 的 缓冲 区 。 图 7-9 是 类 型 为 的 变量 
var 通过 消息 队列 传送 的 流程 。 
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消息 正文 (长 | 接收 消息 
nue MD ex Tm 


六 消息 正文 
tse_sz) 
L_ | 
@O 将 待 发 送 消息 复制 到 消息 缓 。 @ 发 送 消息 @ 接 收 消息 四 取得 消息 
冲 区 memcpy(msg_ptr+4、 mmsgsnd (qidmsg ptr. 。 msgsrcv(qidmsg_ptr、 Imemcpy((void*)S&cvarmsg_ 
(void*)&var,sizeoftT)) sizeof(T).0) buf sz, 消 息 类 型 .0) ptr+4,sizeof(T)) 
7-9 ”类 型 为 T 的 变量 var 通过 消息 队列 传送 的 流程 
程序 框架 及 关键 代码 如 下 : 
int mainO intmain0 
{ f 
T var 店 待 发 送 消息 */ T var 庆 接收 消息 的 变量 */ 
char buffBUFSZ]: 。 #* 消息 缓冲 区 */ char buffBUFSZ]: 。/* 消息 缓冲 区 */ 
qid=msgget(...): qid=msgget(...); 
*((int*)&bu 人 三 消息 类 型 ; msgrev(qid.bufBUFSZ. 消 息 类 型 .0); 
memcpy(buf+4,&var,sizeof(T)): memcpy((void*)&var.buf+4, sizeof(T)): 
msgsnd(qidbufsizeoftT)O): 
2 } 
有 
史 ” 思考 与 练习 题 7.6 下 面 的 进程 A、 进程 B 通 过 消息 队列 通信 ， 请 给 出 进程 BB 的 输出 。 
发 送 方 进程 A: 接收 方 进程 B: 
#include "wrapper.h" #include "wrapper.h" 
int mainO intmain0 
{ { 
int qid; int qid len: 
char buff1024]: char buff1024]: 
*(int*) buf=1: qid= msgget(123.0644IIPC_CREAT): 
strepy(buf+4."abcdefgh"): 
len=msgrcv(qid.buf.sizeoftbuf).2.0): 
qid=msgget(123.0644IIPC_CREAT): printft"len=96d\nmsg=96s\n",len.buf+4): 
msgsnd(qid.buf.strlen(buf+4)+1.0): 
len=msgrcv(qid.buf.sizeoftbuf),1.0); 
*(int*)(buf+4)=2: printf("len=96d\nmsg—=9%s\n".len.buf+4): 
msgsnd(qid.buf+4.strlen(buf+8)+1.,0): } 
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g 思考 与 练习 题 7.7 ”下面 的 进程 A、 进 程 B 通 过 消息 队列 通信 ， 请 给 出 进程 B 的 输出 。 
发 送 方 进程 A: 接收 方 进程 B: 


#include “wrapper.h" #include "wrapper.h" 
intmain0 intmain0 
{ intqidleni: 
int qid; inta[4]: 
inta[4=11.2.3.4}: qid= msgget(123.0644IIPC_CREAT): 
qid=msgget(123,0644lIPC_CREAT): Jen=msgrcv(qid.a.sizeofa).2.0): 
msgsnd(qid,(void*)a,3*sizeoftint),0): printf("len1=%dn ", len); 
for(i=0:1<3; i++) 
msgsnd(qid.(void*\(at1).2*sizeoflint).0): Printf("a[%d]-%d "ali)); 
} 
len=msgrev(qid,a,sizeof(a),1.0): 
Printfl"\nlen2=%d\n",len); 
for(i=0:i<4; i++) 
Printfl("a[%od]=%d "ali)); 
} 
共享 内 存 


通常 情况 下 ，Linux 分 配给 两 个 不 同 进程 的 内 存 区 域 既 不 重合 ， 也 不 重 县 ， 以 防止 进程 之 间 相 
互 干扰 ， 从 而 使 一 个 进程 执行 任何 操作 都 不 会 影响 到 另 一 进程 的 正确 执行 。System V IPC 提供 了 共 
享 内 存 设施 ， 可 创建 允许 两 个 或 多 个 进程 间 共享 访问 的 内 存 块 ， 为 在 多 个 进程 之 间 共 享 和 传递 数据 
提供 了 一 种 高 效 的 方式 。 如 果 某 个 进程 向 共享 内 存 写 入 数据 ， 所 做 的 改动 将 立刻 被 可 以 访问 同一 段 
共享 内 存 的 任何 其 他 进程 看 到 。 


7.3.1 基于 共享 内 存 进行 通信 的 基本 原理 


回顾 在 “计算 机 组 成 原理 ”课程 上 所 学 的 知识 可 知 ， 在 多 用 户 环境 下 ， 进 程 采用 的 地 址 是 程序 
地 址 (又 称 逻 辑 地 址 、 虚 拟 地 址 )， 程 序 地 址 划分 为 很 多 页 或 段 ， 在 指令 执行 过 程 中 ， 由 地 址 转换 机 
构 将 逻辑 地 址 转换 成 存储 器 物理 地 址 。 一 般 情况 下 ， 由 于 系统 给 不 同 进程 分 配 不 同 的 存储 块 ， 因 此 
可 以 认为 ， 不 同 进程 的 程序 地 址 ， 不 管 相同 还 是 不 相同 ， 都 会 映射 到 不 同 的 物理 地 址 。 如 果 要 使 不 
同 进程 共享 物理 内 存 ， 通 过 共享 内 存 传递 数据 ， 就 必须 通过 某 种 特定 手段 才能 实现 。System V IPC 
共享 内 存 的 基本 原理 是 : 根据 进程 请 求 分 配 一 块 大 小 合适 的 存储 块 ， 各 请 求 进程 在 其 地 址 空间 为 该 
共享 内 存 块 安排 程序 地 址 ， 将 程序 地 址 赋值 给 变量 指针 ， 然 后 通过 变量 指针 读 写 共享 内 存单 元 ， 从 
而 传输 数据 。 图 7-10 是 Linux 共享 内 存 的 基本 原理 图 。 需 要 注意 的 是 ， 各 进程 分 配给 共享 内 存 块 的 
多 辑 地 址 范围 可 能 不 相同 ， 但 这 些 逻 辑 地 址 一 定 会 映射 到 相同 的 物理 地 址 区 域 。 

由 于 共享 内 存 并 未 提供 同步 机 制 ， 因 此 我 们 通常 需要 用 其 他 的 机 制 来 同步 对 共享 内 存 的 访问 ， 
一 般 同步 方法 有 三 种 : 

e， 同时 通过 传递 消息 来 同步 对 共享 内 存 的 访问 ， 也 就 是 通过 消息 通信 来 通告 是 否 完成 对 共享 

内 存 的 写 入 或 读 出 操作 。 
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进程 A 地 址 空间 物理 内 存 进程 8 地 址 空间 
| 


1 一 一 | 


6FFF 
5 

La 一 一 | 6| 
0x5000 一 x6000 


图 7-10 Linux 共享 内 存 的 基本 原理 
e 利用 System V IPC 提供 的 信号 量 机 制 。 
。 在 共享 内 存 中 留 出 一 个 标志 单元 用 于 同步 。 
写 进程 结束 对 共享 内 存 的 写 操作 之 前 ， 并 没有 自动 的 机 制 可 以 阻止 读 进程 读 取 共享 数据 。 对 
共享 内 存 访问 的 同步 控制 必须 由 程序 员 负 责 。 
7.3.2 ”共享 内 存 相 关 API 函数 


共享 内 存 相关 API 函数 有 shmget、shmat、shmdt、shmetl 四 个 ,它们 的 函数 声明 在 头 文件 sys/shmh 
中 。 


1. shmget 函数 


shmget 函数 用 于 创建 共享 内 存 ， 该 函数 创建 由 键 值 key 标识 的 共享 内 存 块 ， 并 返回 标识 号 。 如 
果 内 存 块 已 经 存在 ， 就 直接 返回 其 标识 号 。 
#include <sys/shmh> 


int shmget(key_t key, size_t size, int flag): 
返回 值 ， 如 果 共 享 内 存 创建 成 功 ，shmget 返回 一 个 非 负 整数 ， 即 共享 内 存 标识 号 ， 如 果 失败 ， 就 返回 -1。 


key: 共享 内 存 的 键 值 ， 用 于 有 效 地 对 共享 内 存 段 命名 ， 可 唯一 地 标识 一 个 共享 内 存 段 ,用 相同 
的 key 调用 shmget 函数 将 返回 同一 个 共享 内 存 段 标识 号 。 当 key 为 IPC PRIVATE 时 ， 会 创建 只 属 
于 进程 的 私有 共享 内 存 。 

size: 以 字 节 为 单位 指定 需要 共享 内 存 块 大 小 。 

flag: 包含 9 个 位 的 权限 标志 ， 作 用 与 文件 创建 函数 open 的 mode 标志 一 样 ， 创 建 的 新 的 共享 
内 存 段 应 有 IPC_CREAT 标志 。 


2. shmat 函数 


由 shmget 函数 返回 的 共享 内 存 段 还 不 能 被 进程 访问 。 要 想 启用 对 该 共享 内 存 的 访问 ， 必 须 将 其 
映射 到 一 个 进程 的 逻辑 地 址 空间 ， 以 获得 该 共享 内 存 段 的 程序 地 址 。 这 项 工作 由 shmat 函数 完成 ， 
其 定义 如 下 : 


#include <sys/shm h> 
void *shmat (int shm id, const void * shm addr ,int flag) : 
返回 值 : 如 果 shmat 调用 成 功 ， 则 返回 一 个 指向 共享 内 存 中 第 一 个 字 节 的 指针 ; 如果 失 败 ， 就 返回 -1。 


shm id: 由 shmget 函数 返回 的 共享 内 存 标识 符 。 
shm addr: 指定 要 把 共享 内 存 连接 到 当前 进程 的 地 址 ， 一 般 设 置 为 0， 表 示 让 系统 来 安排 共享 
内 存 的 程序 地 址 。 
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flag: 一 组 位 标志 ， 一 般 设 置 为 0。 

3. shmdt 函数 

shmdt 函数 的 作用 是 将 共享 内 存 从 当前 进程 中 分 离 ， 它 的 参数 是 shmat 函数 返 问 的 地 址 指针 。 
注意 ， 将 共享 内 存 分 离 并 不 是 删除 它 ， 只 是 使 该 共享 内 存 对 当前 进程 不 再 可 用 。 


#include <sys/shmh> 
int shmdt( char *shmaddr ); 


返回 值 ， 成功 时 返回 0， 失 败 时 返回 -1。 


4. shmctl 


shmctl 函数 用 于 对 共享 内 存 实施 控制 管理 操作 ， 原 型 如 下 : 
i 


int shmctl(int shm id, int command, stmuct shmid ds *buf ): 


返回 值 ; 成 功 时 返 问 0， 失 败 时 返回 -1。 
shm id: shmget 函数 返回 的 共享 内 存 标识 符 。 
command: 要 采取 的 动作 ， 可 以 取 3 个 值 。 
e@ IPC_STAT: 获取 共享 内 存 的 shmid ds 结构 并 保存 于 buf。 
e@ JIPC SET: 使 用 buf 的 值 设 置 共 享 内 存 shmid_ds 结构 。 
e RMID: 删除 共享 内 存 。 
buf: 一 个 指针 ， 指 向 包含 共享 内 存 模式 和 访问 权限 的 结构 体 。shmid_ds 结构 体 至 少 包含 以 下 
成 员 : 

struct shmid ds { 

wld t shm _permuid; 

uid t shm perm gid: 

mode t shm perm.mod: 


} 
7.3.3 ”共享 内 存 通信 验证 


验证 示例 由 四 个 程序 组 成 : shmcreate.c 程序 创建 一 个 大 小 为 4096 字 节 的 共享 内 存 块 , 键 值 由 命 
令 行 参数 argv[1] 提 供 ; shmwrite.c 程序 将 命令 行 参数 argv[2] 提 供 的 信息 写 入 共享 内 存 ; shmread.c 读 
取 共 享 信息 ， 输 出 显示 ; shmdel.c 删除 共享 内 存 。 


1. shmcreate.c 


shmcreate.c 用 命令 行 参数 argv[1] 提 供 的 键 值 创建 或 检索 共享 内 存 。 
诊 shmcreat'c 源 代码 */ 
下 #include “wrapper.h" 
int main(int argc.char * argv[]) 
{ 
intrtn: 
intmsqid: 
key tkey: 
让 (argc<-D 


2 
3 
4 
5 
6 
7 
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fprintflstderr" 请 以 jmsgcreate <key> 的 形式 运行 ， 给 出 消息 队列 的 键 值 n"); 
exit(1); 
} 


sscanf(argv[1], "%x",&key); 请 将 参数 argv[1] 转 换 成 十 六 进 制 数 站 
msqid = shmget(key,4096, IPC_CREAT |0644); 

exit(0); 

} 


下 面 编译 执行 程序 ， 查 看 消息 队列 是 否 创建 成 功 : 


Sgce -0 shmcreate shmcreatec -L. iwrapper 
$ /shmcreate Ox12345 


S$ ipcs 

--- 一 Shared Memory Segments -一 -一 

key shmid Owner perms bytes nattch status 
Ox00012345 688142 can 644 4096 0 


可 在 最 后 看 到 键 值 为 0x12345 的 共享 内 存 段 。 
2. shmwrite.c 


shmwrite.c 程序 获取 键 值 为 argv[1] 的 共享 内 存 , 将 命令 行 参数 argv[2] 提 供 的 信息 写 入 共享 内 存 。 


话 shmwritec 源 代码 *#/ 
#include "wrapper.h" 
int main(int argc,char * arev[]) 
{ 
int rin; 
int shmid; 
key_t key:; 
Void *shmptr: 
iflargc<=1) { 


fprintflstderr," 请 以 .msgereate <key> 的 形式 运行 ， 给 出 消息 队列 的 键 值 n");: 
exit(1): 


sscanflargv[1], "%%6x".&key); 。 /# 将 参数 argv[1] 转 换 成 十 六 进 制 数 */ 
shmid = shmget(key,4096, IPC_CREAT |0644); 
shmptr = shmat(shmid.0.0): 

memcpy(shmptr.argv[2].strlen(argv[2]) + 1): /* 将 信息 写 入 共享 内 存 */ 
shmdt(shmptr): 

exit(0): 


编译 执行 过 程 如 下 : 
Sgcec -0 shmwrite shmwritec -L. -iwrapper 
Sshmwrite Ox12345 "hello world™" 


可 以 看 出 ， 信 息 “hello world” 已 成 功 写 入 共享 内 存 0x12345。 
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3. shmread.c 
shmread.c 从 共享 内 存 读 出 信息 并 显示 。 


翌 shmreadc 源 代码 */ 
#include "wrapper.h" 
int main(int argc.char* argv{[]) 
{ 
int rtn; 
int shmid; 
key_t key:; 
void *shmptr: 
这 argc<=1) { 


fprintftstderr," 请 以 /msgcreate <key> 的 形式 运行 ， 给 出 消息 队列 的 键 值 n"); 
exit(1); 


} 

sscanflargv[1], "9%x", &key); 。/* 将 参数 argv[]] 转 换 成 十 六 进 制 数 所 
shmid = shmget(key,4096, IPC_CREAT | 0644); 

shmptr = shmat(shmid.0.0): 

printf"96sn",(char*)shmptr); 上 从 共享 内 存 读 出 数据 */ 
shmdt(shmptr); 

exit(0); 

} 


编译 执行 过 程 如 下 : 


Sgcec -0 shmreadshmreadc -L. -Iwrapper 
S$ /shmread Ox12345 
hello world 


共享 内 存 0x12345 中 的 信息 “hello world” 已 成 功 读 出 显示 。 


4. shmdel.c 


shmde.c 负责 删除 共享 内 存 。 


旋 shmdelc 源 代码 */ 

1 #include "wrapper.h" 

2 int main(int argc.char* argv[]) 

3 { 

4 int rtn: 

5 int shmid; 

6 key_tkey: 

1 void *shmptr: 

8 iflargc<=1) { 

9 fprintftstderr." 请 以 /msgcreate <key> 的 形式 运行 ， 给 出 消息 队列 的 键 值 n"); 
10 exit(1): 

11 } 

12 sscanf(argv[1], "%x",&key): 

13 shmid = shmget(key,4096, IPC CREAT |0644); 
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14 shmctl(shmid.IPC RMID,NULL): 
15 exit(0): 

16 } 

编译 执行 过 程 如 下 : 


Sgcc -0 shmdel shmdelc -L -iwrapper 

S$ /shmdel Ox12345 
线 = 思考 与 练习 题 7.8 ”编写 两 个 程序 ,其 中 一 个 程序 将 结构 体 struct STU {char name[10]; int age; 
float height} stu={“ 张 三 ”,20, 1.79} 通 过 共享 内 存 发 给 另 一 个 程序 输出 显示 。 


7.3.4 ”共享 内 存 通信 示例 


我 们 实现 一 个 生产 者 /消费 者 应 用 ， 生 产 者 进程 shmprod.c 循环 读 取 用 户 从 键盘 输入 的 信息 ， 通 
过 共享 内 存 传递 给 消费 者 进程 shmcons.c 显示 输出 ， 用 户 输入 “end” 可 结束 程序 的 执行 。 


1. 共享 内 存 结构 体 和 同步 设计 


为 防止 消费 者 进程 从 空 的 共享 内 存 中 读 取 数 据 或 取 到 旧 的 数据 ， 同 时 也 防止 旧 的 信息 尚未 取 走 
就 被 新 的 信息 覆盖 ， 生 产 者 /消费 者 应 用 必须 解决 同步 问题 。 在 这 里 用 一 种 比较 简单 的 数据 标志 方法 
来 实现 同步 : 在 共享 内 存 中 留 出 一 个 单元 flag 作为 同步 标志 ， 其 他 单元 作为 数据 缓冲 区 buf 使 用 。 
标志 单元 flag 为 0 表示 空闲 内 存 为 空 ，flag 为 1 表示 共享 内 存 中 有 新 的 数据 ，flag 为 2 表示 数据 传 
输 结束 。 初 始 时 flag 为 0， 生产 者 进程 shmprod.c 仅 在 flag=0 时 才能 将 数据 写 入 共享 内 存 ， 并 将 flag 
修改 成 1。 若 写 入 结束 串 “end”， 则 将 flag 改 成 2。 消 费 者 进程 shmcons.c 仅 当 flag=1 时 才能 从 共 
享 内 存 读 出 数据 ， 并 将 flag 标志 修改 为 0。 
将 共享 内 存 设计 成 以 下 结构 体 : 
#define TEXT SZ2048 
struct shared mm { 
int flag: 
char buffTEXT _SZ]: 
a 
2. 创建 共享 内 存 


程序 shmereate.c 创建 大 小 有 要 求 的 共享 内 存 ， 并 将 标志 位 初始 化 为 0。 


让 shmcreate.c 源 代码 */ 

#include "wrapper.h" 

世 #define TEXT SZ 2048 

3 struct shared mm { 

4 int flag:; 

5 char buffTEXT SZ2]: 
6 } *shmptr: 

int main(int argc.char * argv[]) 
8 { 

多 intrtn: 

10 intshmid: 

11 key tkey: 
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12 iflarec—=1) { 

13 fprintflstderr," 请 以 /msgcreate <key> 的 形式 运行 ， 给 出 消息 队列 的 键 值 n"); 
14 exit(1); 

15 } 

16 sscanflargv{[1], "%x",&key): 访 将 参数 argv[1] 转 换 成 十 六 进 制 数 */ 


I shmid = shmget(key, sizeoflstruct shared_mm), IPC_ CREAT |0644); 
18 shmptr= (struct shared_ mm *)shmat(shmid.0.0): 


19 上 # 将 共享 内 存 映射 到 进程 地 址 空间 所 
20 shmptr->flag=0: 庆 初始 化 标志 位 为 0*/ 

21 shmdt(shmptr); 此 解除 共享 内 存 映射 *#/ 

22 exit(0): 

23 } 


3. 设计 生产 者 进程 shmprod.c 


程序 shmprod.c 从 命令 行 参 数 argv[1] 获 得 共享 内 存 键 值 ， 获 得 共享 内 存 ID， 了 映射 共享 内 存 ， 
然后 执行 循环 ， 从 标准 输入 读 入 数据 ， 写 入 共享 内 存 ， 遇 到 “end” 时 结束 循环 ， 最 后 解除 共享 内 
存 映 射 。 
人 # shmprod.c 源 代码 */ 
#include "wrapper.h" 
#define TEXT SZ 2048 
struct shared mm { 
int flag: 
char buff TEXT_SZ2]: 
} *shmptr: 
int main(int argc.char*# argv[]) 
{ 
int rtn; 
int shmid: 
key_t key: 
iflargc<=1) { 
fprintf(stderr," 请 以 /msgcreate <key> 的 形式 运行 ， 给 出 消息 队列 的 键 值 \n"); 
exit(1); 
} 


sscanf(argv[1], "9%x",&key); 。 /# 将 参数 argv[1] 转 换 成 十 六 进 制 数 */ 
shmid = shmget(key, sizeoftstruct shared_mm), IPC_CREAT | 0644); 
shmptr =(struct shared_mm *) shmat(shmid.0.0): 


for (::) { 

while(shmptr->flag!=0); ” # 共享 内 存 中 无 数据 ， 则 退出 */ 
scanft"96s", shmptr->buf):/* 从 标准 输入 读 入 信息 ， 并 写 入 共享 内 存 */ 
if (stremp(shmptr->buf, "end")—0) { 

shmptr->flag=2:; 

break: 
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4. 设计 消费 者 进程 shmcons.c 


程序 shmcons.c 从 命令 行 参数 argv[]] 获 得 共享 内 存 键 值 ， 获 得 共享 内 存 ID， 了 映射 共享 内 存 ， 
然后 执行 循环 ， 从 共享 内 存 读 出 数据 ， 输 出 显示 ， 遇 到 “end” 时 结束 循环 ， 最 后 解除 共享 内 存 
映射 。 


访 shmcons.c 源 代码 */ 


L #include “wrapper.h" 

2 #define TEXT SZ 2048 

< struct shared mm { 

4 int flag:; 

char buffTEXT SZ]: 

6 } *shmptr: 

7 int main(int argc.char* arev[]) 

8 { 

多 int rtn; 

10 int shmid; 

11 key_tkey: 

12 这 argc<]) { 

13 fprintftstderr." 请 以 /msgcreate <key> 的 形式 运行 ， 给 出 消息 队列 的 键 值 n"); 
14 exit(1); 

1 } 

16 sscanflarev[1], "9ox",&key);， ”/* 将 参数 arev[1] 转 换 成 十 六 进 制 数 */ 
17 shmid = shmget(key, sizeoftstruct shared_mm), IPC_CREAT |0644); 

18 shmptr =(struct shared_mm *) shmat(shmid.0.0): 

19 

20 for(:;) { 

21 while(shmptr->flag 一 0); 。 ” 族 共享 内 存 中 有 新 数据 ， 则 退出 */ 
22 Printf("%6s\n", shmptr->buf);。 上 # 从 共享 内 存 读 出 数据 ， 显 示 出 来 */ 
23 shmptr->flag=0; 

24 让 (strcmp(shmptr->buf "end")—0) 

25 break: 

26 } 

27 shmdt(shmptr); 

28 exit(0):; 

20 | 


5. 程序 的 编译 执行 
先 编译 上 述 三 个 程序 : 


$8gcce -0 shmcreate2 shmcreate2.c -L. -wrapper 
Sgcec -0 shmprod shmprodc-L. -Iwrapper 
Sgcec -0 shmcons shmcons.c-L. -iwrapper 


再 执行 程序 。 第 一 步 执行 共享 内 存 创建 程序 : 
$ /shmereate? 0x12346 
Sipcs 


——— Shared Memory Segments -一 -一 
key shmid Owner perms bytes nattch status 
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Ox00012346 786447 can 644 2052 0 

接着 在 两 个 终端 执行 生产 者 进程 shmprod 和 消费 者 进程 shmcons: 

终端 1: 终端 2: 

$ /shmprod Ox12346 $shmcons Ox12346 

hello hello 

"dongeuan university of techonogy”" "dongeuan university of techonogy” 
computer school computer school 

end end 


可 以 看 到 ， 生 产 者 /消费 者 进程 工作 起 来 了 ， 在 终端 1 输入 的 信息 ， 被 正确 传送 到 终端 2 并 显示 
出 来 。 最 后 ， 删 除 共享 内 存 0x12346。 
S$ /shmdel Ox12346 


用 IPC 信号 量 实施 进程 同步 


上 述 生产 者 /消费 者 进程 应 用 如 果 使 用 标志 变量 flag 进行 同步 ， 由 于 涉及 多 进程 并 发 访问 包括 
flag 在 内 的 共享 内 存 ， 只 能 支持 一 个 生产 者 进程 和 一 个 消费 者 进程 。 如 果 这 两 类 进程 多 于 一 个 ， 根 
据 上 一 章 中 的 分 析 ， 可 采用 信号 量 机 制 进行 同步 和 互 斥 。Posix IPC 提供 了 信号 量 集 来 支持 
Linux/UNIX 进程 对 共享 内 存 的 并 发 访问 和 同步 。 


7.4.1 “IPC 信号 量 集结 构 体 及 操作 函数 


Posix 信号 量 集 用 Linux 内 核 的 semid_ds 结构 体 表 示 ， 所 有 信号 量 集 组 成 一 个 数组 。semid ds 
结构 体 定义 如 下 : 


struct semid ds 

{ 
struct ipe_permsem_perm:; 上 # 该 信号 量 集 的 操作 权限 */ 
struct sem *sem_base; /# 该 数组 的 元 素 是 信号 量 结构 体 */ 
ushort sem_nsems: /# sem_base 数组 的 个 数 */ 


struct sem_queue *sem_pending: 片 被 挂 起 的 进程 队列 */ 


而 每 个 信号 量 则 描述 为 : 
struct sem { 
int semval: 片 信号 量 的 当前 值 */ 
int sempid: 上 # 后 操作 的 进程 PID */ 
ushort sement: 证 等 待 信号 量 大 于 当前 值 的 进程 数 */ 
short semzcnt: 上 # 等 待 信号 量 等 于 0 的 进程 数 */ 


信号 量 的 基本 操作 包括 创建 信号 量 、 信 号 量 值 操作 、 获 取 或 设置 信号 量 属性 ， 对 应 的 相关 函数 
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分 别 是 semget、semop、semctl。 它 们 的 函数 声明 在 typeh、ipch 和 semh 这 3 个 头 文件 中 。 
1. 创建 信号 量 


semget 函数 用 于 创建 新 的 信号 量 , 如 果 参 数 key 指定 的 信号 量 集 已 经 存在 , 就 返回 该 信号 量 集 。 
#include <sys/types h> 

#include <sys/ipc h> 

#include <sys/sem h> 

int semget(key_t key., int nsems, int flag): 


返回 值 : 成 功 则 返回 信号 量 描述 字 ， 否 则 返回 -1。 
key: 一 个 整数 类 型 的 键 值 ， 用 来 命名 某 个 特定 的 信号 量 集 ， 含 义 与 msgget 函数 的 key 参数 相 
同 ( 见 7.2.2 节 )。 
nsems: 指定 打开 或 新 创建 的 信号 量 集 包含 的 信号 量 数 目 。 
flag: 包含 9 个 位 的 权限 标志 ， 用 法 与 open 函数 的 mode 标志 相同 。 
由 于 信号 量 集 属于 Linux 内 核 的 数据 结构 ， 用 户 态 进程 不 能 直接 访问 ， 因 此 semget 函数 只 能 返 
回 一 个 整数 类 型 的 描述 字 ， 供 进程 以 后 操作 信号 量 时 使 用 。 


2. 信号 量 值 操作 


信号 量 本 质 上 是 一 个 计数 器 ， 进 程 可 以 使 用 函数 semop 来 增加 或 减少 信号 量 值 ， 以 表示 释放 或 
申请 共享 资源 。 该 函数 声明 为 : 


#include <sys/typesh> 
#include <sys/ipc.h> 


#include <sys/semh> 
int semop(int sem id, struct sembuf *sops, unsigned int nsops); 


semid: semget 函数 返回 的 信号 量 描述 符 。 
nsops: 本 次 操作 的 信号 量 数 目 ， 也 是 sops 指向 的 数组 大 小 。 
sops: 指向 一 个 类 型 为 sembuf 的 结构 体 数组 。 该 结构 体 可 描述 为 : 


struct sembuf { 
ushort sum_num:; 让 待 操作 的 信号 量 在 信号 量 集中 的 索引 值 */ 
short sem_op: 庆 信号 量 操作 ( 正 数 、 负 数 或 0) */ 
short sem flg: 上 # 操作 标志 ,为 IPC_NOWAIT 或 SEM_UNDO*/ 


E 

如 果 sem_op 为 负数 , 就 从 信号 量 值 中 减 去 sem_op 的 绝对 值 , 表示 进程 获取 资源 ; 如 果 sem_op 
为 正 数 ， 就 把 它 加 到 信号 量 上 ， 表 示 归 还 资源 ， 如 果 sem_op 为 0， 则 调用 进程 睡眠 ， 直 到 信号 量 值 
为 0。sem flg 一 般 可 设 为 0。 

3. 获取 或 设置 信号 量 属性 

系统 中 的 每 个 信号 量 集 都 对 应 一 个 stuct sem_ds 结构 体 ， 该 结构 体 记 录 信 号 量 集 的 各 种 信息 ， 
存放 于 内 核 空间 。 为 了 设置 、 取 得 信号 量 集 的 各 种 信息 及 属性 ， 在 用 户 空间 中 应 该 有 一 个 联合 体 与 
其 对 应 ， 即 union semnum， 可 描述 为 : 


#include <linux/sem.h> 
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union semnum { 
int val; 
struct semid_ds *buf: 


上 


信号 量 属性 操作 的 函数 原型 为 : 
#include <linux/sem h> 


int semctl(int semid, int semnum, int cmd, union semun arg); 


返回 值 ， 成 功 则 返回 0， 否 则 返回 -1。 


semid: 信号 量 集 描述 符 。 

semnum: 待 操作 信号 量 在 信号 量 集 semid 中 的 索引 。 

cmd: 指定 具体 操作 类 型 ，arg 是 对 应 的 参数 。 常 用 操作 类 型 有 
SETVAL: 设置 semnum 所 代表 信号 量 的 值 为 arg.val。 
SETALL: 通过 arg.val 更 新 所 有 信号 量 值 。 

IPC_ RMID: 从 内 核 主 存 中 删除 信号 量 集 。 

GETVAL: 返回 smnum 所 代表 信号 量 的 值 。 


7.4.2 用 信号 量 集 创建 自 定义 P/V 操作 函数 库 


由 于 我 们 一 般 习惯 于 在 程序 中 用 每 次 加 1、 减 1 的 P/V 操作 来 写 同步 程序 ， 我 们 用 信号 量 集 来 
创建 一 个 自 定义 P/V 操作 函数 库 。 该 函数 库 包 括 信 号 量 创 建 函 数 createsem、 信号 量 检 索 函 数 getsem、 
信号 量 赋 初 值 函数 initsem、P 操作 、V 操作 、 信 号 量 撤销 函数 delsem 等 几 个 操作 函数 ， 函 数 声明 保 
存在 semlib.h 中 ， 函 数 实现 保存 在 semlib.c 中 。 各 个 函数 的 代码 如 下 : 

谨 基于 IPC 信号 量 的 P/V 操作 函数 的 源 代码 ， 位 于 semlib.c 中 所 


int createsem(key t key) 
{ 


1 

4 

3 Tetum semget(key.].IPC_CREATI0666): 
4 

5 int getsem(key_t key) 
6 

ef 

8 

a 


{ 
Tetum semget(key.1, 0666); 
} 
int initsem(int semid, int initval) 
{ 
union semnum arg: 
Tetum semctl(semid.1, SETVAL.arg): 
} 
int Plint semid) 
{ 
struct sembuf operation: 
operation.sem num=0: 
operation.sem op 一 1: 
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Tetum semop(semid,&operation.1): 
! 
int V(int semid) 
{ 
struct sembuf operation: 
operation sem_num=0: 
operation.sem op=1: 
Tetum semop(semid,&operation.1): 
} 
int delsem(int semid) 
因 


union semun arg 
semctl(semid.0,IPC_RMID. arg); 


寻思 考 与 练习 题 7.9 改写 7.3.4 节 中 的 生产 者 /消费 者 应 用 ， 在 仅 有 一 个 生产 者 和 一 个 消费 者 
的 条 件 下 ， 用 信号 量 集 实现 生产 者 进程 和 消费 者 进程 的 同步 ， 并 进行 测试 。 

结 " 思考 与 练习 题 7.10 改写 7.3.4 节 中 的 生产 者 /消费 者 应 用 , 在 两 个 生产 者 和 两 个 消费 者 同时 
存在 的 条 件 下 ， 用 信号 量 集 实现 生产 者 进程 和 消费 者 进程 的 同步 。 


本 章 小 结 


Linux 进程 一 般 情 况 下 彼此 并 不 相干 ,但 在 某 些 场景 下 它们 也 需要 相互 合作 来 完成 共同 的 任务 ， 
互相 传递 数据 是 合作 进程 间 的 基本 要 求 之 一 。 本 章 介绍 三 种 进程 通信 机 制 : 管道 机 制 、 消 息 队 列 和 
共享 内 存 ， 讨 论 利用 这 些 机 制 实现 进程 间 通 信 的 基本 编程 方法 。 

管道 机 制 在 内 核 中 创建 当 作 管 道 使 用 的 内 存 缓冲 区 ， 按 先进 先 出 方式 进行 访问 ， 写 进程 按 顺序 
将 数据 写 入 管道 ， 读 进程 按 顺 序 从 管道 中 读 取 数据 。 由 于 按 先进 先 出 顺序 进行 数据 传输 ， 其 特征 像 
日 常生 活 中 的 输 水 管 、 输 油管 等 ， 因 此 称 为 管道 。 为 方便 编程 ， 在 Linux 系统 中 完全 用 系统 IO 函 
数 对 管道 进行 读 写 ， 因 此 使 用 上 比较 简单 。 进 程 间 有 了 管道 通信 机 制 ， 就 可 以 创建 客户 端 /服务 器 应 
用 了 。 

采用 消息 队列 进行 通信 时 ， 将 每 次 要 传递 的 信息 封装 成 一 条 消息 ， 发 送 方 发 送 多 少 次 ， 接 收 方 
就 接收 多 少 次 ， 最 后 用 一 条 特定 的 消息 表明 数据 传输 结束 ， 代 码 更 加 规整 、 清 晰 。 

共享 内 存 机 制 通过 特殊 手段 创建 两 个 或 多 个 进程 都 能 读 写 的 共享 内 存 块 ， 由 一 个 进程 写 入 共享 
内 存 块 的 数据 ， 其 他 进程 可 立即 读 出 。 共 享 内 存 是 三 种 通信 方式 中 效率 最 高 的 ， 但 需要 特定 的 同步 
机 制 来 告知 数据 已 存 入 。Linux 系统 提供 了 IPC 信号 量 机 制 来 解决 这 个 问题 。 

消息 队列 、 共 享 内 存 、 信 号 量 属于 System V IPC 的 三 件 套 资 源 。 它 们 有 很 多 相似 的 特征 ， 比 如 
都 用 xxxget 函数 来 创建 或 获取 资源 ， 都 用 关键 字 key 来 表示 资源 ， 访 问 这 些 资源 的 函数 名 都 以 该 类 
资源 的 缩写 开头 ， 如 msgget、shmget、semget。 

进程 间 通 信 机 制 为 创建 单机 上 的 客户 端 /服务 器 应 用 创造 了 条 件 , 学 习 本 章 可 为 未 来 开发 基于 多 
进程 的 数据 库 、 数 据 处 理 、 物 联网 应 用 打下 基础 。 
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课 后 作业 


好 > 思考 与 练习 题 7.11 有 两 个 进程 A 和 B， 进 程 A 读 取 fifo3.c 的 内 容 ， 通 过 命名 管道 发 送 给 
第 二 个 进程 B 并 输出 显示 。 

(1) 采用 命名 管道 传输 信息 ， 写 出 程序 代码 。 

(2) 采用 消息 队列 传输 信息 ， 写 出 程序 代码 。 
喝 ” 思考 与 练习 题 7.12 有 两 个 进程 A、B， 进 程 A 和 B 都 定义 了 下 列 变量 ， 进 程 A 对 变量 进 
行 赋值 ， 要 求 将 变量 的 值 传 递 给 进程 B 并 输出 显示 。 

int a=l; float b=2.2:; double c=3.14159326; 

int arl5]={10,20,30,40,50}; 

(1) 采用 命名 管道 传输 数据 ， 写 出 程序 代码 。 

(2) 采用 消息 队列 传输 数据 ， 写 出 程序 代码 。 

(3) 采用 共享 内 存 传递 数据 ， 写 出 程序 代码 。 
喝 ” 思考 与 练习 题 7.13 有 两 个 程序 msgsendstruct.c 和 msgrecvstruct.c, 前 者 将 结构 体 struct STU 
{char name[10]; int age: float height;》 的 一 个 实例 stu={ " 张 三 ", 20, 1.79} 发 送 给 后 者 并 输出 显示 。 

(1) 采用 命名 管道 传输 数据 ， 写 出 程序 代码 。 

(2) 采用 消息 队列 传输 数据 ， 写 出 程序 代码 。 

(3) 采用 共享 内 存 传递 数据 ， 写 出 程序 代码 。 
和 ”思考 与 练习 题 7.14 编写 两 个 程序 msgsend.c 和 msgrecv.c, msgsend 进程 不 断 从 键盘 读 入 信 
息 ， 传 送 给 进程 msgrecv 显示 出 来 ， 写 出 符合 以 下 三 种 情况 的 程序 代码 : 

(1) 采用 命名 管道 传输 数据 ， 写 出 程序 代码 。 

(2) 采用 消息 队列 传输 数据 ， 写 出 程序 代码 。 

(3) 采用 共享 内 存 传递 数据 ， 用 IPC 信和 号 量 进行 同步 ， 写 出 程序 代码 。 
有 ” 思 考 与 练习 题 7.15 利用 消息 队列 实现 一 个 简单 的 客户 端 /服务 器 应 用 ， 多 个 客户 端 进程 可 
并 发 地 向 服务 器 进程 发 送 消息 ， 服 务 器 向 每 个 客户 端 发 送 消 息 回执 。 比 如 进程 PID 为 1234 的 
客户 端 发 送 的 消息 为 “hello from Process 1234”， 服务器 收 到 该 消息 后 发 回 的 消息 为 “receipt of 
<hello> to Process 1234” 。 

(1) 采用 消息 队列 传输 数据 ， 写 出 程序 代码 。 

(2) 采用 共享 内 存 传递 数据 ， 用 IPC 信号 量 进行 同步 ， 写 出 程序 代码 。 
和 * 思 考 与 练习 题 7.16 编写 一 个 基于 线程 的 聊天 程序 ， 要 求 能 同时 发 送信 息 和 接收 信息 。 

(1) 聊天 双方 通过 消息 队列 传递 信息 ， 写 出 程序 代码 。 

(2) 双方 通过 命名 管道 传递 信息 ， 写 出 程序 代码 。 

(3) 双方 通过 共享 内 存 传递 信息 ， 用 IPC 信号 量 同步 ， 写 出 程序 代码 。 
gp * 思 考 与 练习 题 7.17 阅读 以 下 程序 代码 : 

#include <stdio.h> 

#include <unistd h> 

int mainO { 

pid t pl.p2: 
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} 


请 使 用 IPC 信号 量 机 制 ， 使 程序 的 输出 按 L0、L1、L2 的 顺序 显示 。 


Pl=fork0: 

iflp1—0) { 
printf("L2:This is child process pl\n"): 
exit(0): 


printf("L1: This is child process p2\n"): 


exit(0): 
} 
Pprintf("LO: This is father process pO\n"): 
exit(0); 
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网 络 编程 


日 常生 活 中 我 们 看 到 过 很 多 网 络 应 用 ， 如 浏览 网 页 、 发 送 电子 邮件 、 网 上 购物 ， 实 际 上 都 是 在 
运行 网 络 应 用 程序 。 所 有 的 网 络 应 用 程序 都 基于 相同 的 基本 编程 模型 和 编程 接口 ， 有 着 相似 的 系统 
逻辑 结构 。 网 络 编程 不 但 涉及 很 多 计算 机 系统 相关 概念 ， 例 如 进程 、 线 程 、 信 号 、 信 号 量 、 字 节 序 、 
存储 器 映射 以 及 动态 存储 分 配 ， 还 涉及 一 些 新 的 概念 ， 如 端口 、 卫 地 址 、 套 接 字 、TCP/P 协议 、 
HIML 规范 、HITP 协议 、 客 户 端 /服务 器 模型 等 。 本 章 将 把 所 有 这 些 元 素 整合 起 来 ， 实 现 两 个 结构 
简单 而 基本 完整 的 网 络 应 用 案例 ， 供 读者 解剖 、 学 习 和 模仿 。 


本 章 学 习 目标 : 

e 理解 网 络 通信 结构 和 Intermet 连接 ， 理 解 字 节 序 、 端 口 、 套 接 字 、 卫 地 址 、 域 名 、 客 服 端 / 
服务 器 模型 等 概念 

理解 套 接 字 地 址 结构 ， 理 解 TCP 网 络 通信 程序 的 架构 ， 掌 握 套 接 字 接口 函数 的 调用 规范 
读 懂 网 络 通信 示例 程序 ， 掌 握 简单 的 网 络 编程 方法 

理解 简单 的 HIML 标记 ， 理 解 URL， 理 解 HITP 事务 

读 懂 和 理解 示例 Web 服务 器 的 源 代码 ， 理 解 其 工作 原理 ， 并 进行 实验 验证 


[EL 客户 端 服 务 器 编程 模型 


网 络 应 用 一 般 基 于 客户 端 / 服 务 器 模型 ， 由 一 个 服务 器 进程 和 一 个 或 多 个 客户 端 进程 组 成 。 服 务 
器 管理 、 操 纵 某 种 资源 ， 为 客户 端 提供 某 种 服务 。 例 如 ， 一 个 Web 服务 器 管理 一 组 磁盘 文件 ， 代 
表 客户 端 (如 浏览 器 ) 进 行 网 页 检索 和 执行 功能 。 一 个 FIP 服务 器 也 管理 一 组 磁盘 文件 ， 但 仅 为 客户 
端 (如 Windows 资源 管理 器 ) 提 供 存储 和 检索 功能 。 类 似 地 , 一 个 电子 邮件 服务 器 管理 一 些 邮件 文件 ， 
为 客户 端 (如 FoxmaiD) 提 供 邮 件 发 送 和 接收 功能 。 

客户 端 /服务 器 模型 中 的 基本 操作 是 事务 ， 由 四 步 组 成 ( 见 图 8-1): 

1) 当 一 个 客户 端 需要 某 种 服务 时 , 向 服务 器 发 送 一 个 请 求 , 来 发 起 一 个 事务 。 例 如, 当 Web 浏 
览 器 需要 浏览 一 个 文件 时 ， 就 发 送 一 个 网 络 浏览 请 求 给 Web 服务 器 。 

2) 服务 器 收 到 请 求 后 ， 解 释 请 求 ， 以 适当 的 方式 操作 指定 的 资源 。 例 如 ， 当 Web 服务 器 收 到 
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浏览 器 发 出 的 网 络 浏 览 请 求 后 ， 就 去 读 一 个 磁盘 文件 。 
3) 服务 器 给 客户 端 发 送 一 个 响应 , 并 等 待 下 一 个 请 求 。 例如 , Web 服务 器 将 文件 发 送 回 客户 端 。 


1. 客户 端 发 送 请 求 
es oo 
处 理 响应 进程 ---- 9 3. 服务 器 
到 啊 尼 处 理 请 求 


图 8-1 客户 端 服务 器 事务 


4) 客户 端 收 到 响应 并 处 理 。 例 如 ， 当 Web 浏览 器 收 到 来 自 服务 器 的 网 页 后 ， 就 在 浏览 器 中 显 
示 该 网 页 。 

在 这 里 ， 客 户 端 和 服务 器 都 是 进程 ， 而 不 是 之 前 提 到 的 机 器 、 主 机 或 服务 器 ， 这 一 点 读者 要 注 
意 。 平 常 提 到 的 服务 器 ， 一 般 是 指 性 能 、 可 靠 性 都 非常 高 ， 可 以 部 署 网 站 、 数 据 库 、 应 用 系统 的 一 
种 高 配置 计算 机 。 既 然 客户 端 、 服 务 器 都 是 进程 , 因此 一 台 主 机 可 以 同时 运行 多 个 客户 端 和 服务 器 。 
随 着 集群 、 云 计算 技术 的 发 展 ， 客 户 端 /服务 器 事务 可 以 在 同一 台 或 多 台 主机 上 运行 。 无 论 客 户 端 和 
服务 器 怎样 部 署 到 主机 上 ， 客 户 端 /服务 器 编程 模型 都 是 相同 而 不 变 的 。 


网 络 通信 实际 上 就 是 跨越 网 络 的 进程 间 通 信 , 可 以 将 之 看 作 单机 上 进程 间 通 信 的 一 种 自然 扩展 。 
与 单机 上 的 IPC 机 制 相 比 ， 网 络 通信 在 技术 上 更 加 规范 、 可 靠 ， 功 能 更 强大 ， 兼 容 性 更 好 ， 支 撑 着 
当今 各 种 网 络 应 用 的 运行 。 就 像 单机 上 的 进程 间 通 信 需 要 IPC 机 制 支持 一 样 ， 网 络 通信 需要 主机 安 
装 TCP/IP 协议 (Transmission Control Protocol/Internet Protocol， 传 输 控制 协议 /互联 网 络 协议 )。 目 前 
几乎 所 有 计算 机 系统 (包括 平板 电脑 、 智 能 手机 、 数 码 设备 等 ) 都 内 置 对 该 协议 的 支持 功能 。 因 此 ， 
我 们 现在 能 在 PC、 服 务 器 和 各 种 智能 设备 间 实 现 网 络 通信 功能 ,在 此 基础 上 开发 各 种 电子 商务 、 信 
息 化 管理 、 互 联网 、 物 联网 应 用 系统 。 


8.2.1 网 络 通信 结构 


图 8-2 展示 了 跨 网 络 的 进程 间 通 信 结 构 。 每 台 通 信 主 机 支持 TCP/IP 协议 ,协议 支持 软件 屏蔽 了 
网 络 通信 模块 和 过 程 细节 ， 将 数据 以 分 组 为 单位 从 一 台 主机 传送 到 另 一 台 主 机 ， 具 体 网 络 通信 原理 
可 回顾 在 “计算 机 网 络 “ 课 程 上 所 学 的 知识 。 这 层 软件 以 系统 调用 函数 的 形式 向 进程 提供 套 接 字 编 
程 接口 。 进 程 只 要 提供 数据 , 指明 接收 方 地 址 ,TCP/P 软件 就 会 代表 进程 将 数据 发 送 给 指定 的 主机 。 
进程 可 通过 套 接 字 编程 接口 ， 从 TCP/P 软件 层 获 取 其 他 主机 上 的 进程 发 给 自己 的 数据 。 

TCP/IP 实际 上 是 一 个 协议 族 ， 其 中 每 一 个 协议 都 提供 不 同 的 功能 。 例 如, 中 协议 提供 基本 的 编 
址 方法 和 递送 机 制 ， 将 数据 从 一 台 主 机 发 往 其 他 主机 ， 也 叫 作 数据 报 (datagram)。 下 协议 只 是 把 数据 
发 送出 去 ， 不 管 对 方 是 否 接收 成 功 ， 因 而 从 某 种 意义 上 讲 是 不 可 靠 的 。UDP(Unreliable Datagram 
Protocol, 不 可 靠 数据 报 协议 ) 对 卫 协 议 进 行 了 简单 包装 , 可 支持 不 同 主机 的 进程 间 数据 通信 。TCP 构 
建 在 中 之 上 ， 要 求 接收 方 对 收 到 的 数据 进行 确认 ， 并 支持 重 发 功能 ， 提 供 进 程 间 可 靠 的 全 双 工 (双向 ) 
连接 。 为 了 简化 讨论 ， 在 这 里 不 讨论 其 内 部 工作 原理 ， 只 讨论 TCP 和 了 为 应 用 程序 提供 的 某 些 基本 
功能 ， 在 此 基础 上 讨论 基于 TCP 的 网 络 编程 方法 ，UDP 网 络 编程 留 给 读者 自学 。 
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图 8-2 跨 网 络 的 进程 间 通 信 结 构 
从 程序 员 的 角度 看 ， 可 以 把 套 接 字 编程 模型 看 成 图 8-3 所 示 的 结构 。TCP/IP 协议 软件 为 每 种 网 
络 功能 创建 一 个 称 为 套 接 字 (Socket) 的 内 核对 象 ， 客 户 端 、 服 务 器 各 一 个 。 套 接 字 (Socket) 用 中 地址 
和 端口 号 两 个 字段 标识 。 当 需要 进行 网 络 通信 时 ， 进 程 只 需要 将 数据 发 送 给 Socket，Socket 就 会 将 
数据 传送 给 接收 方 的 Socket， 接 收 方 进程 可 从 相应 的 Socket 读 取 传 过 来 的 数据 。 
套 接 字 接 口 网 卡 套 接 字 接口 


主机 A | 主机 B 
[oy ER 
: TCP/IP 协 | 
Socket (IP 地 址 ， 端 口号 ) 议 软件 Socket (IP 地 址 ， 端 口号 ) 


图 8-3 ” 套 接 字 编 程 模型 


8.2.2 Internet 连接 


采用 TCP 协议 的 通信 结构 如 图 8-4 所 示 。 首 先 在 两 个 进程 间 建 立 TCP 连接 ， 它 是 类 似 于 电话 
接 通 后 为 通话 双方 建立 起 来 的 一 条 通信 链 路 。Intemet 客户 端 和 服务 器 在 连接 上 发 送 和 接收 字 节 流 。 
一 个 TCP 连接 两 个 通信 进程 ， 实 现 点 对 点 通信 。 数 据 可 在 TCP 链 路 上 同时 双向 流动 ， 因 而 TCP 通 
信和 是 全 双 工 的 。 由 于 有 接收 确认 和 重 发 功能 ， 从 源 进程 发 出 的 字 节 流 能 以 发 送 顺序 被 目的 进程 接收 ， 
TCP 通信 具有 可 靠 数 据 传输 特性 。 一 个 连接 可 看 成 一 对 进程 间 进行 网 络 通信 的 管道 , 它 有 两 个 端点 ， 
每 个 端点 都 是 一 个 套 接 字 (Sockeb。 


TCP 连 接 


TcP/IP 协 
”一 议 软件 : 
Socket (IP 地 址 ， 端 口号 ) Socket (IP 地 址 ， 端 口号 ) 


图 8-4 TCP 通信 结构 
每 个 套 接 字 都 设置 一 个 由 32 位 他 地 址 和 16 位 整数 端口 号 组 成 的 地 址 ， 用 “J 人 P 地 址 :端口 号 ” 
表示 ， 卫 地 址 用 于 确定 通信 主机 ， 端 口号 用 于 定位 主机 上 的 通信 进程 。 一 个 连接 由 它 两 端的 套 接 字 
地 址 唯一 确定 ， 这 对 套 接 字 地 址 叫 作 套 接 字 对 (socket paiD， 可 看 成 以 下 元 组 : 
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(cliaddr:cliport, servaddr:servport) 
其 中 ，cliaddr 是 客户 端的 他 地址 ，cliport 是 客户 端的 端口 号 ，servaddr 是 服务 器 的 他 地址 ， 


servport 是 服务 器 的 端口 号 。 图 8-5 演示 了 Web 客户 端 和 Web 服务 器 之 间 的 连接 。 
TCP 连 接 套 接 字 对 


Q192 :12345, 14.215.177.37:80) 


1 
服务 器 端 套 接 字 地 址 


主机 B 的 TP 地址 
14.215. 177. 37 14.215.177.37:80 


8-5 ”Intemet 连接 示例 


在 这 个 示例 中 ，Web 客户 端的 套 接 字 地 址 是 219.222.192.242:12345， 其 中 端口 号 12345 是 内 核 
分 配 的 临时 端口 号 。Web 服务 器 的 套 接 字 地 址 是 14.215.177.37:80， 其 中 端口 号 80 是 和 Web 服务 
关联 的 公开 端口 号 。 给 定 这 些 客户 端 和 服务 器 套 接 字 地 址 ， 客 户 端 和 服务 器 之 间 的 连接 就 由 下 列 套 
接 字 对 唯一 确定 : 

(219.222.192.242:12345, 14.215.177.37:80) 

客户 端 是 TCP 连接 请 求 的 发 起 者 ， 其 套 接 字 端 口号 由 操作 系统 内 核 自 动 分配 ， 称 为 临时 端口 号 
(ephemeral port)。 而 服务 器 的 套 接 字 端口 号 通常 是 某 个 众所周知 的 公开 值 ， 与 某 个 服务 相对 应 。 公 
开端 口号 的 范围 是 1~1023， 临 时 端口 号 的 范围 为 1024~5000。 例如，Web 服务 器 通常 使 用 端口 80， 
而 电子 邮件 服务 器 使 用 端口 5。UNIX 主机 上 的 文件 /etc/services 包含 这 台 机 器 提供 的 服务 及 其 公开 
端口 号 的 综合 列表 。 这 样 分 配 端 口号 ， 人 们 就 可 直接 使 用 公开 端口 ， 开 发 电子 邮件 收发 软件 、 浏 览 
器 等 客户 端 软件 ， 而 不 需要 了 解 相应 服务 器 的 实现 细节 。 

TCP 连接 建立 好 后 ， 进 程 就 调用 send 和 recv 两 个 套 接 字 接口 函数 进行 数据 收发 。Linux 系统 还 
为 每 个 套 接 字 分 配 了 一 个 文件 描述 符 ， 支 持 进程 使 用 read、write 函数 ， 像 读 写 文件 一 样 ， 进 行 网 络 
数据 的 传送 。 


套 接 字 地 址 与 设置 方法 


8.3.1 IP 地 址 和 字 节 序 


虽然 一 般 用 点 分 十 进 制 形式 给 出 人 P 地 址 ， 由 四 段 构成 ， 每 段 不 超过 2355， 如 219.222.10.10; 但 
卫 地 址 在 计算 机 内 部 表示 成 32 位 的 无 符号 整数 ， 在 网 络 编程 中 可 看 成 以 下 形式 的 他 地 址 结构 : 

刻下 地 址 结构 的 定义 ， 源 代码 位 于 系统 头 文件 netinetinh 中 / 

雍 Intemet 地 址 结构 */ 

struct in addr { 

unsigned int s_addr: 网 络 字 节 序 ( 大 端 模 式 ) 。 */ 
Bs 
在 ip addr 结构 体 中 ， 要 求 32 位 的 他 地址 按 网 络 字 节 顺序 (简称 网 络 序 ) 存 放 在 字段 saddr 中 。 
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网 络 序 采用 大 端 模式 (big-endian)， 要 求 整 型 、 浮 点 型 等 数据 类 型 的 高 位 数字 保存 在 地 址 较 小 的 字 节 
中 。 比 如 ， 假 定 一 个 八 位 的 十 六 进 制 整数 0x12345678 存放 在 起 始 地 址 为 1000 的 存储 器 单元 中 ， 占 
有 地 址 为 1000、1001、1002、1003 的 四 个 字 节 。 如 果 按 大 端 模式 存放 ， 则 0x12、0x34、0x56、0x78 
按 顺 序 保存 在 1000、1001、1002、1003 四 个 内 存单 元 中 。 

主机 平台 存储 数据 的 字 节 顺序 称 为 主机 字 节 顺序 (主机 序 )， 通 常 x86、ARM 主机 平台 的 字 节 序 
为 小 端 模式 (little-endian)， 整 型 、 浮 点 型 等 数据 类 型 的 低位 数字 保存 在 地 址 较 小 的 字 节 中 。 按 小 端 模 
式 存储 , 整数 0x12345678 的 四 个 字 节 0x12、0x34、0x56、0x78 分 别 保存 在 地 址 为 1003、1002、1001、 
1000 的 内 存单 元 中 。 主 机 序 是 在 主机 上 给 变量 直接 赋值 时 数据 各 字 节 存放 的 单元 顺序 ， 因 此 ， 如 果 
我 们 定义 一 个 中 地址 变量 “struct in_addr addr”， 则 执行 赋值 语句 addr.s_addr=0x12345678 后 ， 保 
存 到 变量 addr 中 的 是 一 个 小 端 模式 的 他 地 址 ， 不 符合 网 络 编程 的 要 求 。 因 此 ， 不 能 在 程序 中 将 32 
位 的 下 地 址 直接 赋 给 stuct in_addr 结构 体 ， 而 应 先进 行 字 节 序 转换 。 

虽然 多 数 常见 的 主机 序 是 小 端 模 式 ， 但 也 有 一 些 主 机 采用 大 端 模 式 。 无 论 采 用 何 种 字 节 序 ， 
TCP/IP 协议 软件 提供 了 以 下 函数 来 实现 short 和 int 型 数据 在 主机 序 和 网 络 序 之 间 的 转换 : 

#include <netinetin h> 

unsigned long int htonl(unsigned long int hostlong); 

unsigned short int htons(unsigned short int hostshort); 


返回 值 : 采用 网 络 字 节 顺序 的 值 。 
unsigned long int ntohl(unsigned long int netlong): 
unsigned short int ntohs(unsiged short int netshort); 


返回 值 ， 采用 主机 字 节 顺序 的 值 。 

honl 函数 将 32 位 整数 由 主机 字 节 顺序 转换 为 网 络 字 节 顺序 。ntohl 函数 将 32 位 整数 从 网 络 字 
节 顺 序 转换 为 主机 字 节 顺序 。htons 和 ntohs 函数 用 于 16 位 整数 的 转换 ， 可 用 于 端口 号 的 转换 。 记 
忆 技 巧 : n 表示 网 络 (network)，h 表示 主机 (hosb，1 表示 32 位 整数 (long)，s 表示 16 位 整数 (short)， 
to 表示 转换 。 

有 了 这 两 个 函数 ， 要 将 32 位 的 卫 地 址 0x12345678 写 入 上 述 变量 ， 就 可 这 样 写 : addrs_add= 
htonl(Ox12345678)。 

四 地址 通常 是 以 一 种 称 为 点 分 十 进 制 的 表示 法 来 表示 ， 它 用 十 进 制 数 表示 下 地 址 的 每 个 字 节 ， 
字 节 间 以 句点 分 开 。 例 如 ，128.2.194.242 就 是 地 址 0x8002c2 包 的 点 分 十 进 制 表 示 ， 其 中 128=0x80， 
2=0x02，193=0xc2，242=0xf2。TCP/IP 协议 软件 提供 inet_aton 和 inet_ntoa 函数 来 实现 中 地 址 的 点 
分 十 进 制 表示 与 32 位 整 型 网 络 序 表示 之 间 的 转换 : 

#include <arpa/inet h> 

int inet_aton(const char *cp. struct in_addr *inp); 


返回 值 :成 功 则 为 1， 出 错 则 为 0。 
char *inet_ntoa(struct in_addr in); 
返回 值 :如果 成 功 ， 返 回 指向 点 分 十 进 制 字符 串 的 指针 ， 和 否则 返回 0。 
inet_aton 函数 将 点 分 十 进 制 字符 串 (cp) 转 换 为 采用 网 络 字 节 顺 序 的 他 地 址 (inp)，inet_ntoa 函数 
将 使 用 网 络 字 节 顺序 的 人 P 地 址 转换 为 对 应 的 点 分 十 进 制 字符 串 。 在 这 里 ，n 表示 网 络 (network)，a 
表示 应 用 (application)，to 表示 转换 。 
将 点 分 十 进 制 瑟 地 址 192.168.2.102 写 入 上 述 瑟 地 址 变量 的 方法 是 : inet_aton("192.168.2. 102", 
&addr,s_addr)。 
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Linux 系统 使 用 hostname 命令 查看 主机 的 点 分 十 进 制 地 址 ， 比 如 : 


Shosmame -i 
192.168.2.102 


有 ”思考 与 练习 题 8.1 完成 表 8-1。 


表 8-1 填写 地 址 
点 分 十 进 制 地 址 十 六 进 制 地 址 
Oxl 
OxfffffffF 
Ox7f000001 


219.222.171.9 


74.13.150.12 
172.16.24.5 


到 "思考 与 练习 题 8.2 


(1) 编写 程序 hex2dd.c, 它 将 十 六 进 制 参数 转换 为 点 分 十 进 制 字符 串 并 打印 出 结果 (程序 中 不 


要 调用 系统 函数 )。 例 如 : 


$ /hex2dd 0x8002c3P 
128.2.194.242 


(2) 编写 程序 dd2hex.c， 它 将 点 分 十 进 制 参数 转换 为 十 六 进 制 数 并 打印 出 结果 (程序 中 不 要 


调用 系统 函数 )。 例 如 : 


$ /dd2hex 219.322.171.9 
Oxdbdeab09 


“思考 与 练习 题 8.3 ”阅读 下 面 的 代码 , 假设 主机 采用 小 端 模 式 , 分 析 运 行 结果 , 并 给 出 解释 。 


#include "wrapper.h" 

int mainO{ 
unsigned int mn; unsigned short k: char *a.*b,*c:; 
Im=0x12345678: n=htonl(0x12345678): 
a=(char*)&m:; b=(char*)&n: c=(char#)&ck: 
c[0F'l';c[1]=2'; 
Printf("a[]=%2x%2x%2x%2x\n",a[0].a[1].a[2].a[3)): 
printf("b[]=%2x%2x%2x%2x\n",*b,*(b+1).*(b+2),*(b+3)): 
Printf("k=%x\n",k); 

} 


8.3.2 Internet 域名 


在 Intermnet 上 互相 通信 时 使 用 人 P 地 址 来 定位 主机 ， 由 于 人 P 地 址 难以 记忆 ， 一 般 为 主机 指定 容 
易 记忆 的 名 字 ， 称 为 域名 (domain name)， 并 创建 一 种 将 域名 映射 到 人 P 地 址 的 机 制 , 这 样 在 网 络 上 通 


信 时 就 可 使 用 域名 来 表示 主机 。 


域名 是 一 串 用 句点 分 隔 的 标识 符 ( 字 母 、 数 字 和 短 横 线 )， 如 www.baidu.com。 域 名 的 集合 形成 
一 个 层次 结构 ， 主 机 域名 就 是 主机 在 这 个 层次 结构 中 位 置 的 编码 。 图 8-6 展示 了 域名 层次 结构 的 一 
部 分 ， 这 是 一 个 树 型 结构 ， 叶 节点 表示 主机 ， 从 叶 节点 反 向 到 树 根 的 路 径 形 成 主机 的 域名 。 子 树 称 
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为 子 域 (subdomain)。 层次 结构 中 的 第 一 层 是 一 个 未 命名 的 根 节点 , 下 一 层 是 一 组 一 级 域名 (first-level 
domain name)， 由 非 营利 组 织 ICANN(Internet Corporation for assigned Names and Numbers， 互 联网 名 
称 与 数字 地 址 分 配 协会 ) 定 义 。 常 见 的 一 级 域名 有 com、edu、gov、org 和 net。 
再 下 一 层 是 二 级 ( second-level) 域 名 , 例如 cmu.edu， 这 些 域名 由 ICANN 授权 各 代理 按照 先 来 先 
服务 的 原则 分 配 。 获 得 二 级 域名 的 组 织 可 以 在 其 子 域 中 创建 新 域名 。 
未 命名 的 根 节点 


18.62.0.96 18.62.1.6 
8-6 ”Intemet 域名 层次 结构 的 一 部 分 

Intemet 构建 了 域名 集合 到 人 P 地 址 集合 之 间 的 映射 。1988 年 以 前 ， 映 射 通过 主机 上 的 文本 文件 
hosts.txt 来 手工 维护 。 之 后 ， 由 全 球 范围 内 的 专门 数据 库 ( 称 为 DNS[Domain Name System， 域 名 系 
统 ]) 来 维护 。 DNS 数据 库 由 数 百 万 如 下 所 示 的 主机 条 目 结构 host entry structure) 组 成 , 其 中 每 个 条 目 
定义 一 个 域名 (包括 一 个 官方 名 字 h_name 和 一 组 别名 h_aliases) 和 一 组 IP 地 址 (h_addr_list) 之 间 的 
映射 ， IP 地 址 是 32 位 的 网 络 序 整数 。 用 数学 语言 描述 ， 可 将 每 条 主机 条 目 看 成 域名 和 下 地 址 的 等 
价 类 。 

店 DNS 主机 条 目 结构 ， 位 于 系统 头 文件 netdbh 中 */ 


上 # 主机 的 官方 名 字 */ 
上 # 主机 名 称 数组 */ 


启 主机 地 址 类 型 */ 
此 主机 地 址 长 度 ， 按 字 节 计算 六 
char *##h addr list ”上 # 网 络 地 址 结构 体 数组 */ 


在 Windows 命令 窗口 中 可 用 nslookup 命令 检索 主机 : 


C> nslookup wamw.huawei.com 

服务 器 : unknown 

地 址 : ”219.222.191.9 

非 权 威 应 答 : 

名 称 :huawei.dtwscache.ourwebcdn.com 

地 址 : ”183.6.246.16 

别名 www.huaweicom 
www.huawel.com.akadns.net 
Www.huaweicom Ixdns.com 


网 络 应 用 程序 可 调用 gethostbyname 和 gethostbyaddr 函数 ,从 DNS 数据 库 中 检索 任何 主机 条 目 。 
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#include <netdbh> 
struct hostent *gethostbyname(const char  *name): 

返回 值 ; 车 成 功 ， 则 为 hostent 指针 ， 出 错 则 为 null， 同 时 设置 h_ermo。 
struct hostent *gethostbyaddr(const char *addr, int len. 0): 

返回 值 ; 车 成 功 ， 则 为 hostent 指针 ， 出 错 则 为 null， 同 时 设置 h_ermo。 


gethostbyname 函数 返回 和 域名 name 相关 的 主机 条 目 。gethostbyaddr 函数 返回 一 个 与 点 分 十 进 
制 格 式 的 下 地 址 addr 相关 联 的 主机 条 目 ， 该 函数 的 第 二 个 参数 为 人 P 地 址 的 字 节 长 度 ， 第 三 个 参数 
一 般 来 说 总 是 0。 两 个 函数 都 可 用 来 获取 网 络 字 节 顺序 的 32 位 四 地址。 

程序 hostinfo.c 是 调用 gethostname 和 gethostbyaddr 函数 ,用 域名 和 点 分 十 进 制 瑟 地 址 检索 DNS 
条 目的 一 个 示例 。 

/*hostinfo.c 源 代 码 ， 功 能 是 检索 并 输出 一 个 DNS 主机 条 目 */ 

#include "wrapper.h" 

int main(int argc, char **argv) 


char *##pp: 
struct in_addr addr:; 
struct hostent *hostp; 


让 (argc !=2){ 
fprintf(stderr, "usage: %s <domain name or dotted-decimal>\n", argv[0]): 
exit(1); 

} 


if (inet_aton(argv[1], &addn !=0) 

hostp = gethostbyaddr((const char *)&addr. sizeoftaddr), AF_INET): 
else 

hostp = gethostbyname(argv[1]): 


Printf("official hostname: %s\n", hostp->h_name): 
for (pp = hostp->h_aliases; *pp != NULL: pp++) 
Printf("alias: %s\n", *pp): 


for (pp = hostp->h_addr list *pp (= NULL: pp++) { 
addr.s_addr =*((unsigned int *)*pp): 
printf("address: %s\n", inet_ntoa(addr)): 

} 

exit(0); 


} 
hostinfo 可 执行 程序 从 命令 行 读 取 域名 或 点 分 十 进 制 地 址 , 并 输出 相应 的 主机 条 目 。 下 面 是 根据 
域名 和 下 地址 检索 主机 条 目的 使 用 案例 : 


§$ /Mostinfo 219.222.191.131 
official hostname: sw.dgut.edu.cn 
address: 219.222.191.131 

S$ /hostinfo www.dgut.edu.cn 
official hostname: www.dgut.edu.cn 
address: 219.222.191.1 


315 


address: 113.105.128.128 
每 台 Intemet 主机 都 有 本 地 域名 localhost， 这 个 域名 总 是 映射 为 本 地 回 送 地 址 (loopback address) 
127.0.0.1， 为 在 开发 阶段 调试 网 络 应 用 提供 方便 。hostinfo 可 执行 程序 也 可 检索 这 个 域名 : 


$hostinfo Tocalhost 
official hostname: localhost 
alias: localhost.localdomain 
address: 127.0.0.1 


8.3.3” 套 接 字 地 址 结构 


一 个 有 相应 描述 符 的 打开 文件 。 

Intemet 的 套 接 字 地 址 存放 在 如 下 所 示 的 类 型 为 sockaddr in 的 16 字 节 结构 中 。 对 于 Intemet 应 
用 ，sin_family 成 员 的 值 固定 为 AF_INET，sin_port 成 员 是 一 个 16 位 的 端口 号 ,而 sin_addr 成 员 则 
是 32 位 人 P 地 址 。 耳 地 址 和 端口 号 都 是 按 网 络 字 节 顺序 (大 端 模式 ) 存 放 的 。 


入 通用 套 接 字 地 址 结构 (用 于 连接 、 绑 定 和 接收 ) */ 
struct sockaddr { 

unsigned short sa_family; 。/* 协议 族 */ 

char sa_data[14]: 


上 Intemet 风格 的 套 接 字 地 址 结构 */ 

struct sockaddr in { 

unsigned short sa_family: 。 /* 地址 族 ， 总 是 AF_INET */ 
unsigned short sin_port; 启 网 络 字 节 顺序 中 的 端口 号 */ 
stmuctin addrsin addr 。。”/* 网 络 字 节 顺序 中 的 下 地 址 所 
unsigned char sin_zero[8]: 。 /# 结构 体 sockaddr 的 大 小 */ 


由 于 很 多 传统 网 络 应 用 要 求 以 sockaddr 结构 体 指针 作为 套 接 字 接口 函数 的 参数 ， 为 与 此 兼容 ， 
在 网 络 编程 中 仍旧 使 用 sockaddr 结构 体 指针 来 设置 Socket 对 象 的 地 址 。 但 为 了 编程 方便 ， 定义 
sockaddr_in 结构 体 来 设置 套 接 字 地 址 ， 直 接 将 端口 号 、 了 P 地 址 赋值 给 单独 字段 。sockaddr 结构 体 与 
sockaddr_in 结构 体 中 第 一 个 成 员 的 名 称 、 含义 和 类 型 完全 相同 , 但 它 把 sockaddr in 结构 体 的 后 三 个 
字段 看 成 14 字 节 的 字符 数组 。 一 般 先 创建 sockaddr_in 结构 体 ， 设 置 好 各 个 字段 ， 再 在 调用 套 接 字 
接口 函数 时 , 在 需要 套 接 字 地 址 的 地 方 , 将 sockaddr in 结构 体 指针 强制 转换 成 sockaddr 指针 。 为 了 
简化 代码 示例 ， 这 里 采用 定义 下 面 的 类 型 : 

typedef struct sockaddr SA: 


EE 套 接 字 接口 与 TCP 通信 编程 方法 


套 接 字 接口 (socket interface) 是 一 组 函数 ,可 与 UNIX 1/O 函数 结合 起 来 , 用 以 建立 网 络 连接 , 收 
发 数据 ， 开 发 和 创建 网 络 通 信 应 用 。UNIX/Linux、Windows 和 大 多 数 现代 操作 系统 都 支持 套 接 字 接 
口 。 图 8-7 给 出 了 基于 套 接 字 接口 的 TCP 通信 程序 的 框架 。 
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open_listen_sock 
open_client_socl 


等 待 下 一 个 客户 
端的 连接 请 求 


8-7 ”基于 套 接 字 接 口 的 TCP 通信 程序 的 框架 


首先 ， 服 务 器 调用 open listen sock， 创 建 一 个 监听 连接 请 求 的 描述 符 ， 客 服 端 调用 
open_client_sock 发 出 连接 请 求 ， 服 务 器 调用 accept 接受 连接 。 如 果 握 手 成 果 ， 双 方 都 返回 建立 好 的 
连接 。 之 后 双方 可 通过 连接 进行 数据 通信 。 套 接 字 接口 用 套 接 字 或 文件 描述 符 表示 建立 好 的 连接 ， 
这 样 ， 除 专用 的 套 接 字 接口 函数 外 ， 还 可 调用 UNIX IO 函数 在 网 络 连接 上 发 送 和 接收 数据 。 

下 面 介绍 TCP 网 络 通信 的 主要 函数 ， 最 后 用 toggle 服务 器 (该 服务 器 返回 大 小 写 翻转 的 字符 串 ) 
来 演示 这 些 函数 的 使 用 方法 。 


8.4.1 socket 函数 


网 络 通信 都 需要 通过 套 接 字 (Sockeb 来 收发 数据 , 客户 端 和 服务 器 都 使 用 socket 函数 来 创建 套 接 
字 ， 返 回 套 接 字 描 述 符 (socket descriptor)。 
i 


#include <sys/socket h> 
int socket(int domain, int type , int protocol): 


返回 值 ， 若 成 功 ， 返 回 非 负 的 套 接 字 描述 符 ， 和 否则 返回 -1。 
在 网 络 编程 中 总 是 带 下 面 这 样 的 参数 来 调用 socket 函数 : 
client_sock = socket(AF_ INET , SOCK_ STREAM. 0); 
其 中 , AF INET 表明 基于 Intemet 通信 ,SOCK_STREAM 表示 这 个 套 接 字 是 Intemet 连接 的 一 
个 端点 ， 采 用 TCP 协议 通信 (如 果 采 用 UDP 协议 通信 ， 则 参数 type 的 值 应 该 为 SOCK_DGRAM)。 
socket 函数 返回 的 client_sock 描述 符 只 是 部 分 打开 , 还 不 能 用 于 读 写 , 因为 尚未 与 服务 器 建立 连接 。 
如 何 完 成 套 接 字 打 开工 作 与 通信 端的 类 型 (客户 端 还 是 服务 器 ) 有 关 。 


8.4.2 ”connect 函数 
客户 端 通过 调用 connect 函数 来 建立 和 服务 器 的 连接 。 在 connect 函数 执行 期 间 ， 客 户 端 发 起 连 
接 请 求 ， 与 服务 器 实际 交换 了 3 个 数据 包 ， 协 商 各 种 参数 后 ， 建 立 连接 。 


#include <sys/socketh> 
int connect (int client_sock , struct sockaddr *serv_addr , int addrlen): 


返回 值 ; 若 成 功 ， 则 为 0， 否 则 为 -1。 
connect 函数 试图 与 套 接 字 地 址 为 serv_addr 的 服务 器 建立 网 络 连接 ， 其 中 addrlen 的 值 是 
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sizeof(sockaddr in)。connect 函数 会 被 阻塞 ， 直 到 连接 成 功 建立 或 发 生 错 误 。 如 果 成 功 ，client_sock 
套 接 字 描述 符 就 准备 好 可 以 读 写 了 ， 并 且 得 到 的 连接 是 由 以 下 套 接 字 对 表示 的 : 

(x:y, serv_addr.sin addrserv_addrsin port) 

其 中 x 表示 客户 端的 他 地 址 , y 表示 客户 端的 端口 号 。 执 行 connect 函数 时 系统 自动 分 配 和 设 
置 客 户 端 套 接 字 地 址 (x,y)。 客 户 端 套 接 字 地 址 (x,y) 唯 一 确定 了 客户 端 进程 。 


8.4.3 ”open_client_sock 函数 


由 于 socket 和 connect 函数 的 调用 顺序 和 参数 都 基本 固定 ,我 们 将 socket 和 connect 函数 包装 成 
辅助 函数 open_client_sock， 可 给 编程 带 来 方便 ， 客 户 端 可 以 用 它 来 和 服务 器 建立 连接 。 


open_client_sock 函数 与 运行 在 主机 hostname 上 的 服务 器 建立 连接 ， 一 个 打开 的 套 接 字 描 


述 符 ， 可 以 借助 send/recv 或 UNIX 1/O 函数 来 收发 数据 。 下 面 给 出 ee 函数 的 代码 。 
人 # open_client_sock 源 代 码 ， 位 于 wrapper.c 中 */ 
1 int open_client sock(char *hostname, int port) 
2 { 
3 int client_sock: 
4 struct hostent *hp; 
5 struct sockaddr in serveraddr 
6 
7 f((client_sock = socket(AF INET. SOCK_ STREAM. 0)) <0) 
8 Tetum -1; 上 # 如 果 出 错 ， 返 回 -1 */ 
9 
10 族 填写 服务 器 的 他 地址 和 端口 */ 
11 if((hp = gethostbyname(hostname)) — NULL) 
12 Tetum -2; 让 如 果 出 错 ， 返 回 -2 */ 
13 bzero((char *) &serveraddr. sizeoftserveraddr)): 
14 serveraddr.sin family =AF INET': 
15 bcopy((char *) hbp->h_addr list[0]. 
16 (char *)&zserveraddr.sin_addr.s_addr, hp->h length): 
17 serveraddr.sin_port = htons(port): 
18 
19 上 # 与 服务 器 建立 连接 */ 
20 if(connect(client_sock. (SA *) &serveraddr. sizeoflserveraddr)) < 0) 
21 Tetum -1: 
2 Tetum client_sock: 
3 } 


创建 套 接 字 描述 符 (第 7 行 ) 后 ， 调 用 gethostbyname 函数 来 检索 服务 器 的 DNS 主机 条 目 (第 11 

行 )， 拷 贝 主机 条 目 中 的 第 一 个 卫 地 址 (网 络 字 节 顺序 ) 到 用 数值 0 初始 化 各 字 节 (第 13 行 ) 的 服务 器 

套 接 字 地 址 结构 (第 15 和 16 行 ) 中 。 然 后 用 采用 网 络 字 节 顺序 的 服务 器 的 公开 端口 号 初始 化 套 接 字 

址 结构 (第 17 行 )， 发 起 到 服务 器 的 连接 请 求 (第 20 行 )。 当 connect 函数 返回 套 接 字 描述 符 时 ， 网 
络 连接 建立 成 功 ， 客 户 端 可 用 send/recv 或 UNIX VO 函数 和 服务 器 通信 。 
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8.4.4 ”bind 函数 
套 接 字 函数 bind、listen 和 accept 主要 由 服务 器 调用 ， 用 于 与 客户 端 建立 连接 。 


#include <sys/socket.h> 


intbind(int serv_sock, struct sockaddr *my_addr , int addrlen): 


返回 值 :车 成 功 ， 则 为 0， 否则 为 -1。 
bind 函数 告诉 内 核 将 my_addr 中 的 服务 器 套 接 字 地 址 和 套 接 字 描述 符 serv_sock 绑 定 ， 设 置 套 
接 字 对 象 的 地 址 ， 参 数 addrlen 为 sizeoflsockaddr in)。 


8.4.5 listen 函数 


客户 端 是 发 起 连接 请 求 的 主动 实体 ， 服 务 器 是 等 待 来 自 客户 端的 连接 请 求 的 被 动 实体 。 内 核 认 
为 socket 函数 创建 的 描述 符 默 认为 主动 套 接 字 (active socket), 客户 端 可 直接 用 来 调用 connect 函数 以 
建立 连接 。 但 服务 器 需要 调用 listen 函数 以 设置 套 接 字 ， 告 知 内 核 ， 描 述 符 是 由 服务 器 而 不 是 客户 
端 使 用 的 被 动 套 接 字 ( 或 称 监听 套 接 字 )。 

#include <sys/socketh> 


int listen(int servV_sock, int backlog); 


返回 值 ， 若 成 功 ， 则 为 0， 否则 为 -1。 

listen 函数 将 serv_sock 从 主动 套 接 字 转换 为 监听 套 接 字 ， 监 听 套 接 字 可 以 接收 来 自 客户 端的 连 

接 请 求 。 参 数 backlog 表示 到 达 服 务 器 但 尚未 完成 连接 的 请 求 数量 , 若 等 待 连接 的 请 求 数 达 到 backlog 

时 ， 又 有 新 的 连接 请 求 到 达 ， 这 些 请 求 就 被 拒绝 。 通 常 将 backlog 参数 设置 为 一 个 较 大 的 值 ， 比 如 
1024。 


8.4.6 open_listen_sock 函数 


我 们 发 现 ， 将 socket、bind 和 listen 函数 结合 成 名 为 open_listen_sock 的 辅助 函数 也 可 给 编程 带 
来 方便 ， 服 务 器 通过 调用 它 就 可 直接 返回 一 个 监听 描述 符 。 


#include “wrapper.h" 


int open_listen_sock(int port): 


下 面 展示 open_listen_sock 函数 的 实现 代码 。 该 函数 首先 打开 并 返回 一 个 监听 描述 符 ( 第 7 和 第 8 
行 )， 该 描述 符 在 公开 端口 port 上 接收 连接 请 求 。 接 着 使 用 setsockopt 函数 (此 处 未 作 介绍 ) 配 置 服务 
器 (第 11 行 )， 使 其 能 被 立即 终止 和 重启 。 因 为 默认 情况 下 ， 重 启 服务 器 将 在 大 约 30 秒 内 拒绝 客户 
端的 连接 请 求 ， 会 给 程序 调试 带 来 不 便 。 

接 下 来 初始 化 服务 器 的 套 接 字 地 址 结构 ， 为 调用 bind 函数 做 准备 。 在 该 例 中 ， 我 们 以 
INADDR_ANY 通配符 作为 他 地 址 (第 19 行 ), 表示 服务 器 将 接收 发 送 到 这 台 主 机 的 任何 他 地址 (一 
台 主 机 可 有 多 个 正 地 址 ) 的 请 求 ， 并 设置 公开 端口 port (第 20 行 )。 程 序 中 的 htonl 和 htons 函数 用 于 
将 中 地 址 和 端口 号 从 主机 字 节 顺序 转换 为 网 络 字 节 顺序 。 最 后 , 我 们 将 listen_sock 转换 为 一 个 监听 
描述 符 (第 25 行 )， 并 将 它 返 回 给 调用 者 (第 27 行 )。 


让 open_listen_sock 函数 的 代码 实现 ， 位 于 wrapper.c 中 */ 
int open listen sock(int port) 
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int listen_sock, optval=1: 
struct sockaddr in serveraddr: 


/* Create a socket descriptor */ 
Hf((listen_sock = socket(AF_INET. SOCK_STREAM. 0))<0) 
Tetum -1; 


/* Eliminates "Address already in use" error from bind */ 
f(setsockopt(listen_sock, SOL_SOCKET., SO REUSEADDR., 
(const void *)&optval , sizeoftint)) < 0) 
Tetum -1; 


/* listen_sock is an endpoint for all requests to port received 
from any IP address for this host */ 
bzero((char *) &serveraddr, sizeoflserveraddr)): 
serveraddr.sin family =AF INET: 
serveraddr.sin_ addr.s addr = htonl(INADDR_ANY): 
serveraddr.sin_port = htons((unsigned short)port): 
if (bind(listen_sock, (SA *)&serveraddr., sizeoflserveraddr)) <0) 
Tetum -1; 


/* convert the the sock to a listening socket ready to accept connection requests */ 
if (listen(listen_sock, LISTENQ) <0) 


8.4.7 accept 函数 


服务 器 通过 调用 accept 函数 来 等 待 来 自 客户 端的 连接 请 求 : 
#include <sys/socket h> 


int accept(int listen_sock, struct sockaddr *addr .int *addrlen): 


accept 函数 等 待 来 自 客户 端的 连接 请 求 到 达 侦 听 描 述 符 listen_sock， 连 接 成 功 后 在 addr 中 保存 
客户 端的 套 接 字 地 址 ， 并 创建 一 个 新 的 套 接 字 对 象 用 于 与 客户 端 通信 ， 返 回 一 个 指向 该 对 象 的 已 连 
接 描述 符 (connected descriptor)， 可 在 该 描述 符 上 调用 send/recv 或 UNIX 1O 函数 以 与 客户 端 通信 。 

进行 网 络 编程 需要 弄 清 监 听 描 述 符 和 已 连接 描述 符 之 间 的 差别 。 监 听 描 述 符 作为 客户 端 连 接 请 
求 的 一 个 端点 ， 一 般 被 创建 一 次 ， 并 存在 于 服务 器 的 整个 生命 周期 中 。 已 连接 描述 符 是 客户 端 和 服 
务 器 之 间 已 建 好 连接 的 一 个 端点 。 服 务 器 每 次 接收 连接 请 求 时 都 会 创建 一 个 新 的 已 连接 描述 符 ， 它 
只 存在 于 服务 器 为 一 个 客户 端 服务 的 过 程 中 。 

图 8-8 描述 了 监听 描述 符 和 已 连接 描述 符 的 创建 过 程 。 第 一 步 ， 服 务 器 调用 accept 函数 ， 等 待 
连接 请 求 到 达 监 听 描 述 符 。 假 定 监 听 描 述 符 为 3。 因 为 描述 符 0-2 已 预 留 给 标准 输入 /输出 文件 (参见 
第 4 章 )。 第 二 步 ， 客 户 端 调用 connect 函数 ， 发 送 一 个 连接 请 求 到 listen_sock。 第 三 步 ，accept 函 
数 打开 一 个 新 的 已 连接 描述 符 conn_sock (我 们 假设 是 描述 符 4), 在 client_sock 和 conn_sock 之 间 建 
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立 连接 ， 并 且 随 后 返回 conn_sock 给 应 用 程序 。 客 户 端 也 从 connect 函数 返回 ， 此 后 ， 客 户 端 和 服务 
器 就 可 以 分 别 通过 读 写 client_sock 和 conn_sock 来 回 传送 数据 了 。 


listen_sock=3 
1. 服务 器 调用 accept 阻塞 ， 等 待 监 


[ 客户 端 ] 5 服务 器 听 描 述 符 lister_sock 上 的 连接 请 求 


client_sock 


listen_sock=3 


一 = 二 2 客户 端 调用 connect 函数 ， 创 建 连 
[ #»% }o ass ] 接 请 求 ， 阻 塞 connect 函数 的 执行 
client_sock 


listen_sock=3 3. 服务 器 从 accepth 函数 返回 conn_sock， 客 
[A 十 号 十 服 务 器 ] 。 户 端 从 connect 函数 返回 ， 从 而 在 elient_soek 
与 conn_sock 之 间 建立 连接 


client_sock conn_sock=4 


图 8-8 监听 描述 符 和 已 连接 描述 符 


8.4.8 send/recv 函数 
send 和 recv 函数 分 别 用 于 在 已 连接 套 接 字 上 发 送 和 接收 数据 : 
#include <sys/socket h> 


ssize_t send(int sock, const void *buff size_t nbytes, int flags); 
返回 值 : 若 成 功 ， 则 为 实际 发 送 的 字 节 数 ， 若 出 错 ， 则 为 SOCKET_ERROR。 


ssize_t recv(int sock, void *buff size tnbytes, int flags): 
返回 值 : 若 成 功 ,返回 实际 接收 的 字 节 数 ; 若 出 错 ， 则 为 SOCKET_ERROR。 如 果 recv 函数 在 等 待 协 这 
接收 数据 时 发 生 网 络 中 断 ， 则 返回 0。 
recv 和 send 函数 的 前 3 个 参数 等 同 于 read 和 write 函数 的 (参看 第 4 章 )。 其 中 sock 是 已 连接 套 
接 字 描 述 符 ，buff 是 存放 待 发 送 数据 或 接收 数据 的 缓冲 区 地 址 ，nbytes 是 发 送 数据 字 节 数 或 接收 缓 
冲 区 长 度 。flags 一 般 设置 为 0。 由 于 套 接 字 描 述 符 是 文件 描述 符 的 一 种 ， 因 此 也 可 使 用 write/read 
函数 发 送 和 接收 数据 。 


学 习 网 络 编程 的 有 效 方法 是 研究 网 络 通信 应 用 示例 的 代码 。 在 这 里 给 出 一 个 简单 的 togsgle 应 用 
程序 ， 在 该 应 用 中 ， 客 户 端 togglec.c 将 从 标准 输入 读 到 的 字符 串 发 送 给 服务 器 togglesic， 服 务 器 对 
收 到 的 字符 串 进行 大 小 写 转换 ， 将 英文 字母 小 写 转 大 写 、 大 写 转 小 写 后 发 给 客户 端 显示 出 来 。 

下 面 是 toggle 客户 端 代码 ， 以 命令 行 参数 argv[1]、argv[2] 作 为 服务 器 的 主机 名 和 端口 号 (第 13 
和 第 14 行 )， 与 服务 器 建立 连接 (第 16 行 )， 然 后 进入 循环 ， 反 复 从 标准 输入 读 取 文本 行 (第 18 行 )， 
发 送 给 服务 器 (第 19 行 )， 从 服务 器 读 取 回 送 的 行 (第 20 行 )， 显 示 到 标准 输出 (第 21 行 )。 当 fgets 函 
数 在 标准 输入 上 遇 到 EOF 时 ， 或 者 当 用 户 键入 CalHHD 时 ， 或 者 进行 重 定向 的 输入 文件 的 所 有 文本 
行 被 读 完 时 ， 该 函数 返回 0， 循 环 结束 ， 客 户 端 关闭 描述 符 而 终止 。 这 会 导致 发 送 一 个 EOF 标志 到 
服务 器 ， 服 务 器 会 从 其 recv 函数 调用 收 到 值 为 0 的 返回 码 ， 从 而 检测 到 这 次 通信 已 结束 。 
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#include "wrapper.h" 


int main(int argc, char **argv) 
{ 
int client sock. port: 
char *host, buff MAXLINE]: 


Tio trio; 


f(argc =3){ 


fhrintf(stderr, "usage: %s <host><port>\n", argv[OD: 


exit(1); 
由 
host= argv[]; 
Pport = atoi(argv[2)); 


client_sock = open_client_sock(host, port): 


while (fgets(buf MAXLINE. stdin) != NULL) { 
send(client_sock, buf strlen(buf).0); 
Tecv(client_sock, buf MAXLINE.0): 
fputs(buf stdout); 

!; 

close(client_sock): 

exit(0); 

} 


/*toggle 应 用 的 客户 端 程序 togglec.c 的 源 代码 */ 


下 面 展 示 了 toggle 服务 器 的 主 程序 togglesi.c。 在 打开 监听 描述 符 (第 17 行 ) 后 ， 进 入 无 限 循环 。 
每 次 循环 都 调用 accept 函数 ， 等 待 一 个 来 自 客户 端的 连接 请 求 (第 20 行 )， 并 从 请 求 中 提取 客户 端 套 
接 字 地 址 (包括 客户 端正 地 址 和 端口 号 )， 保 存 到 类 型 为 SA( 类 型 SA 就 是 结构 体 类 型 struct sockaddr 
和 struct sockaddr_in) 的 结构 体 变量 clientaddr 中 ， 经 处 理 后 输出 已 连接 客户 端的 域名 和 人 P 地 址 (第 


23~26 行 )， 并 调用 toggle 函数 为 这 些 客户 端 服务 (第 28 行 )。 在 togsle 函数 调用 返 
闭 连接 描述 符 。 一 旦 客户 端 和 服务 器 关闭 各 自 的 描述 符 ， 连 接 也 就 终止 了 。 


这 是 


加 


后 ，main 函数 关 


的 toggle 服务 器 代码 比较 简单 ,一 次 仅 处 理 一 个 客户 端 请 求 , 服务 器 依次 以 客户 方式 迭代 ， 


称 为 迭代 服务 器 (iterative server)。 同 时 能 处 理 多 个 客户 端 请 求 的 服务 器 称 为 并 发 服务 器 (concurrent 
server)， 其 实现 比较 复杂 一 些 ， 而 且 有 多 种 不 同 实现 方案 ， 这 将 在 下 一 章 中 进行 介绍 。 


人 # 迁 代 式 toggle 服务 器 togeglesic 的 main 函数 */ 
#include "wrapper.h" 


Void toggle(int conn_sock): 


int listen_sock., conn_sock., port clientlen: 
struct sockaddr in clientaddr: 
struct hostent *hp; 

10 char *haddrp: 

11 f(argc =2) { 


1 
3 
4 
5 int main(int arge. char **argv) 
6 
号 
8 
9 
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1 fprintflstderr, "usage: %s <port>\n", argv[0]): 

13 exit(1): 

14 和 

15 Port = atoi(argv[1)): 

16 

17 listen_sock = Open listen_sock(port): 

18 while (D) { 

19 clientlen = sizeoftclientaddr); 

20 conn sock = accept(listen sock, (SA *)&cclientaddr &clientlen): 
21 

妆 /* determine the domain name and IP address of the client */ 
23 hp = gethostbyaddr((const char *)&clientaddr.sin addr.s addr, 
24 sizeoftclientaddr.sin_addr.s_ addr). AF_INET): 

5 haddm = inet_ntoa(clientaddr.sin_addr): 

26 printf("server connected to %s (%s)\n", hp->h_name, haddrp): 
2 

28 toggle(conn sock): 

29 close(conn sock): 

30 } 

31 exit(0); 

32 } 


最 后 是 toggle 程序 的 代码 ,toggle 程序 反复 读 写 文本 块 (第 8 行 ), 对 读 到 的 文本 进行 大 小 写 转换 
(第 12~15 行 )， 再 写 回 网 络 连接 (第 17 行 )， 直 到 recv 函数 调用 遇 到 EOF 而 返回 0。 


收服 务 器 toggle 函数 源 代码 ， 位 于 文件 togglec， 
它 需 与 togglesic 一 起 编译 ， 才 能 生成 toggle 服务 器 程序 */ 


1 #include "wrapper.h" 

2 

Ee void toggle(int conn_sock) 

4 { 

5 size_tn; inti; 

6 char buf[ MAXLINE]: 

7 

8 while((n =recv(conn_sock, buf. MAXLINE.0)> 0) { 
9 Printf("toggle server received %d bytesm". n): 
10 

11 for(i=0; i<n; itH) 

12 iflisupper(buffi]) 

13 buffij=tolower(buffi]): 

14 else iftislower(buffi])) 

15 buffij=toupper(bufli]); 

16 

这 send (conn_sock. buf n. 0): 

18 } 

19 3 


下 面 编译 这 两 个 程序 : 


$ gcc -0 togglec togglecc -L. -Mrapper 
$ gcc -0 togglesi togglesic togglec -L. -MWrapper 


然后 打开 三 个 终端 窗口 ， 首 先 在 第 一 个 终端 窗口 中 启动 服务 器 ， 然 后 按 顺 序 在 第 二 、 第 三 个 终 
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端 窗口 中 启动 客户 端 ， 输 入 信息 。 


终端 窗口 1: 运行 服务 器 终端 窗口 2: 运行 客户 端 终端 窗口 3;: 运行 客户 端 
S$ /ogglesi 12345 $ /ogglec localhost 12345 $ /togglec localhost 12345 
server received 6 bytes hello This is Terminal 2 
server received 43 bytes HELLO 

GREAT WAILL 

great wall 


从 运行 结果 可 以 看 出 ， 在 先 启动 的 togglec 中 输入 的 信息 都 被 togglesi 接收 ， 并 显示 出 接收 的 字 
符 数 , togglec 也 收 到 从 togglesi 回 送 的 字符 串 。 但 在 后 启动 的 togglec 中 输入 的 字符 串 没有 被 togglesi 
可 送 回 来 。 这 是 因为 togglesi 按 迭 代 方 式 ， 每 次 只 能 接收 一 个 togglec 的 请 求 并 建立 连接 ， 回 送 收 到 
的 字符 串 。 读 者 还 可 以 注意 到 ， 如 果 按 Cal+tD 终止 先 启动 的 togglec， 则 后 启动 的 togglec 与 togglesi 
的 连接 会 立即 建立 起 来 ， 输 入 的 字符 串 马 上 被 回 送 。 
守 思考 与 练习 题 8.4 ”编写 一 个 网 络 通信 程序 ， 客 户 端 从 服务 器 获取 指定 的 文件 保存 起 来 ， 并 显 
于 思考 与 练习 题 8.5 ”编写 一 个 网 络 通信 程序 ， 客 户 端 将 指定 文件 上 传 到 服务 器 ， 服 务 器 保存 
和 输出 文件 内 容 。 
史 * 思 考 与 练习 题 8.6 ”查阅 资料 ， 采 用 UDP 协议 实现 toggle 示例 的 客户 端 和 服务 器 。 


Web 编程 基础 


前 面 介绍 的 toggle 示例 一 个 简单 的 网 络 通信 应 用 ， 属 于 客户 端 /服务 器 模式 应 用 。 采 用 服务 器 和 
客户 端 编程 模型 时 要 事先 协商 好 数据 含义 和 交互 方式 ， 设 计 通 信 协 议 。 每 次 开发 新 的 应 用 时 ， 都 要 
重新 设计 通信 协议 , 重新 编写 客户 端 和 服务 器 程序 。 这 里 存在 两 个 问题 : 一 是 对 于 比较 复杂 的 应 用 ， 
通信 协议 的 设计 比较 难 ， 容 易 出 错 ; 二 是 客户 端 部 署 在 很 多 不 同位 置 ， 升 级 和 维护 困难 。Web 模式 
很 好 地 解决 了 这 一 问题 ，Web 应 用 只 需要 进行 服务 器 端 开 发 ， 客 户 端 是 各 种 标准 的 浏览 器 。Web 服 
务 器 与 Web 客户 端 (浏览 器 ) 按 标准 的 HITP 协议 进行 通信 ， 大 大 简化 了 通信 协议 的 设计 。 本 节 介 绍 
Web 基本 概念 和 HTTP 协议 , 展示 一 个 完整 而 简洁 的 Web 服务 器 ,让 读者 对 Web 技术 与 Web 服务 
器 编程 有 个 基本 认识 。 


8.6.1 Web 基础 


Web 客户 端 和 服务 器 之 间 使 用 一 个 基于 文本 的 应 用 层 协议 进行 交互 ， 该 协议 称 为 HITP 
(Hypertext Transfer Protocol， 超 文本 传输 协议 )。 通 信 过 程 是 ， Web 客户 端 (浏览 器 ) 打 开 一 个 到 服务 
器 的 网 络 连接 ， 然 后 请 求 某 些 内 容 ;， 服务 器 响应 所 请 求 的 内 容 ， 然 后 关闭 连接 ， 浏 览 器 读 取 这 些 内 
容 ， 并 把 它们 显示 在 屏幕 上 。 

Web 服务 器 和 浏览 器 之 间 交 互 的 内 容 用 HIML 语言 (Hypertext Markup Language, 超 文本 标记 语 
言 ) 表 达 。 一 次 交互 的 完整 内 容 可 看 成 一 个 HIML 网 页 ，HTML 网 页 包含 许多 标记 以 指示 浏览 器 如 
何 显示 网 页 中 的 各 种 文本 和 图 形 对 象 。 例 如 : 


<b> Make me bold! </b> 
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上 述 代 码 告诉 浏览 器 用 粗 体 字 输 出 <b> 和 </b> 标 记 之 间 的 文本 。HTML 语言 的 强大 功能 之 一 是 
超 链 接 ， 超 链接 可 作为 指针 指向 存放 在 任何 ntemet 主机 上 的 内 容 。 例如， 如 下 格式 的 HTML 代码 : 

<a href=http://vww.baidu.eduindex html> 百 度 </a> 

上 述 代 码 告知 浏览 器 高 亮 显 示 文 本 “百度 ”， 并 且 创 建 一 个 超 链接 ， 指 向 存放 在 百度 上 的 文件 
名 为 ndex.html 的 HTML 文件 。 如 果 用 户 单 击 这 个 高 亮 显示 的 文本 对 象 ， 浏 览 器 就 会 从 百度 的 服务 
器 上 请 求 相 应 的 HTML 文件 并 显示 。 


8.6.2 Web 内 容 


除 HTML 页 面 文件 外 ， 在 Web 客户 端 和 服务 器 间 还 可 传输 其 他 类 型 的 数据 ， 一 般 来 说 ， 符 合 
MIME(Multipurpose Intemet Mail Extensions， 多 用 途 网 际 邮件 扩充 协议 ) 的 内 容 都 能 传输 ， 表 8-2 中 
列 出 了 一 些 常用 的 MIME 类 型 。MIME 协议 规范 使 Web 应 用 具有 很 强 的 数据 传输 能 力 。 实 际 上 ， 
随 着 技术 和 规范 的 发 展 ， 当 今 的 浏览 器 /Web 应 用 能 够 实现 的 功能 几乎 与 客户 端 /服务 器 应 用 没有 差 
别 ， 大 多 数 网 络 应 用 都 采用 Web 结构 。 


表 8-2 常用 MIME 类 型 


MIME 类 型 描述 
text/html HTML 页面 
text/plain 无 格式 文本 (如 .txt 文件 ) 
application/pdf PDF 文档 
image/gif 8if 格式 编码 的 二 进 制图 像 
imagelipeg jpeg 格式 编码 的 二 进 制图 像 
gz application/x-gzip GZIP 文件 ， .gz 
video/mpeg MPEG 文件 : mpg、mpeg 


Web 服务 器 以 两 种 不 同 的 方式 向 客户 端 提 供 Web 内 容 : 

(1) 取 一 个 磁盘 文件 ， 并 将 它 的 内 容 返 回 给 客户 端 。 磁 盘 文 件 称 为 静态 内 容 (static contenD， 俗 
称 静 态 网 页 ， 返 回 磁盘 文件 内 容 给 客户 端的 过 程 称 为 服务 静态 内 容 (feeding static content)。 

(2) 运行 一 个 命令 或 程序 ， 将 其 以 某 种 MIME 格式 产生 的 输出 返回 给 客户 端 。 运 行 可 执行 文件 
产生 的 输出 称 为 动态 内 容 (dynamic content), 俗称 动态 网 页 ， 而 运行 程序 并 返回 输出 到 客户 端的 过 程 
称 为 服务 动态 内 容 (feeding dynamic content)。 

由 Web 服务 器 返回 的 内 容 都 可 看 成 Intemet 上 的 资源 ， 有 一 条 资源 路 径 ， 路 径 名 称 为 
URL(Universal Resource Locator， 通 用 资源 定位 符 )。 例 如 : 

http://www.baidu.com:80/index.html 

上 述 URL 表示 Intemet 主机 www.google.com 上 路 径 为 index html 的 HIML 文件 ， 它 是 静态 内 
容 ， 由 一 个 监听 端口 为 80 的 Web 服务 器 管理 。Web 服务 器 默认 的 网 络 端口 是 80， 也 可 以 设置 成 其 
他 端口 号 。 
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生成 动态 内 容 的 可 执行 文件 的 URL 可 以 在 文件 名 后 添加 调用 参数 ,用 字符 ?分 隔 文件 名 和 参数 ， 
参数 之 间 用 字符 & 分 隔 开 。 例 如 : 

http://172.28.89.9:8000/cgi-bin/add?2017&523808 

上 述 URL 标识 Web 服务 器 172.28.89.9 上 由 端口 号 8000 管理 的 路 径 为 /cgi-bin/add 的 可 执行 文 
件 ， 该 文件 在 执行 时 有 两 个 字符 串 类 型 的 命令 参数 2017 和 523808。 

在 事务 过 程 中 ， 客 户 端 和 服务 器 使 用 的 是 URL 的 不 同 部 分 。 例 如 : 

http://www.google.com:80 


客户 端 使 用 前 绥 来 决定 与 哪 类 服务 器 联系 、 服 务 器 在 哪里 以 及 监听 的 端口 号 是 多 少 。 服 务 器 使 
用 后 级 “/index.html” 为 路 径 在 文件 系统 中 搜寻 文件 ， 据 此 分 辨 请 求 的 是 静态 内 容 还 是 动态 内 容 。 
要 了 解 服务 器 如 何 解释 URL 的 后 绥 ， 有 几 点 需要 注意 : 

(1) 判断 URL 指向 静态 内 容 还 是 动态 内 容 没 有 标准 的 规则 。 每 个 服务 器 可 按 各 自 规则 管理 文件 。 
一 种 常用 的 方法 是 ， 为 Web 服务 器 指定 一 个 或 一 组 目录 ， 按 目录 分 类 组 织 Web 服务 器 内 容 ， 例 如 
将 可 执行 文件 保存 在 cgi-bin 目录 中 ， 而 将 静态 网 页 保存 在 html 目录 中 。 

(2) URL 后 缀 中 最 开始 的 那个 “/” 一 般 并 不 表示 UNIX/Linux 根 目录 ， 而 是 被 请 求 内 容 所 属 类 
型 的 主 目录 。 例 如 ， 可 以 将 服务 器 配置 成 :所 有 静态 内 容 存 放 在 目录 /usr/httpd/html 上 ， 所 有 动态 内 
容 存放 在 目录 /usrhttpd/cgi-bin 下 ， 这 时 URL 后 缀 中 的 根 目录 “/” 实 际 上 是 /srhttpd。 

(3) 最 短 的 URL 后 缀 是 字符 “/”， 省 略 资源 文件 名 ， 如 http://www.baidu.com/。 一 般 服务 器 会 
在 其 后 添加 默认 的 资源 文件 名 ， 如 index.html， 补 充 成 为 完整 的 路 径 /index.html。 这 样 在 浏览 器 中 键 
入 域名 就 可 打开 网 站 的 首页 。 有 时 浏览 器 提供 的 URL 后 缀 为 空 ， 连 字符 “/” 都 没有 ， 如 
http://www.baidu.com。 这 时 ， 服 务 器 会 自动 加 上 默认 路 径 /index.html。 
寻思 考 与 练习 题 8.7 如 果 Web 服务 器 不 将 数据 作为 文本 封装 成 HTML 文件 格式 传递 给 浏览 
器 ， 而 是 直接 将 某 个 结构 体 所 在 的 存储 器 内 容 作 为 二 进 制 值 传递 ， 这 样 做 有 何不 妥 ? 


8.6.3 HTTP 事务 


浏览 器 和 Web 服务 器 之 间 采 用 HTTP 协议 进行 通信 ， 一 次 网 页 浏览 过 程 中 ， 浏 览 器 和 Web 服 
务 器 间 的 数据 传输 过 程 称 为 HITP 事务 。 通 常 在 传输 网 页 内 容 之 前 ， 需 要 进行 多 次 数据 交换 。 由 于 
HTTP 是 基于 文本 的 ， 这 些 数 据 都 是 以 文本 方式 进行 传输 的 。 使 用 UNIX/Linux 的 telnet 程序 能 够 连 
接任 何 Web 服务 器 并 执行 事务 (浏览 器 和 Web 服务 器 间 的 一 次 完整 交互 )， 可 以 查看 浏览 器 与 Web 
服务 器 间 实 际 的 数据 传送 详情 。 因 此 ，telnet 可 方便 用 来 调试 服务 器 与 客户 端 会 话 。 例 如 ， 下 面 的 代 
码 给 出 了 使 用 telnet 向 百度 服务 器 请 求 首页 的 交互 过 程 。 

在 第 1 行 , 我 们 在 Linux 终端 窗口 中 运行 telnet 命令 , 要 求 打开 一 个 到 百度 服务 器 的 连接 。 telnet 
命令 输出 三 个 文本 行 (第 2~4 行 )， 表 示 请 求 连 接 服务 器 成 功 ， 等 待 我 们 输入 文本 行 (第 5 行 )。 每 次 输 
入 一 个 文本 行 ， 以 回 车 结束 ，telnet 命令 会 读 取 该 行 ， 在 后 面 添 加 回 车 和 换行 符 (rn)， 并 发 送 到 服务 
器 。 这 是 HTTP 协议 标准 所 要 求 的 , 每 个 文本 行 都 由 一 对 回 车 和 换行 符 结束 。 现 在 ,我 们 输入 HITP 
请 求 (第 $-7 行 ， 第 7 行为 空 ， 用 于 结束 请 求 报头 ) 以 发 起 一 个 事务 ， 百 度 服 务 器 返回 HTTP 响应 (第 
8~19 行 )， 然 后 关闭 连接 (第 20 行 )。 


1 $ teinet www.baidu.com 80 Clientopen connection to server 
3 Trying 58.217.200.112... telnet prints 3 lines to the temminal 
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3 Connected to www.a.shifen.com. 

4 Escape character is “J'. 

5 GET/HTIP/1.] Client: request line 

6 HOST: WWW.BAIDU.COM Client: request http1.1 header 

Nh Client: empty line terminates request 

8 HTTP/1.1 200 OK Server: response line 

9 Date: Sun, 06 Aug 2017 04:05:08 GMT Server: several response headers 

10 Content-Type: text/html 

11 Content-Length: 14613 

12 Last-Modified: Thu, 27 Jul 2017 04:30:00 GMT 

13 2 

14 Accept-Ranges: bytes 

15 Server empty line end response headers 
16 <html> Serverfirst html line in response body 
于 <head> 

18 有 

19 </body></html> Server:last line in response body 

20 Connection closed by foreign host. Server: close connection 

21 $ Client: close connection and terminates 
1.HTTP 请 求 


HTTP 请 求 的 组 成 为 : 一 个 请 求 行 (第 5 行 )， 后 面 跟着 零 个 或 多 个 请 求 报头 (第 6 行 )， 再 跟 一 个 
空 的 文本 行 来 终止 报头 列表 (第 7 行 )。 请 求 行 的 形式 是 : 
<method> <uri> <version> 


HTTP 支 持 许多 不 同 的 方法 (method)， 包 括 GET、POST、OPTIONS、HEAD、PUT、DELETE 
和 TRACE。 这 里 仅 讨论 广 为 应 用 的 GET 方 法 ， 有 调查 表明 ，99% 的 HTTP 请 求 采用 GET 方 法 。GET 
方法 用 URI(Uniform Resource Identifier， 统 一 资源 标识 符 ) 标 识 指 定 服务 器 生成 和 返回 的 内 容 。URI 
是 相应 URL 的 后 级， 包括 文件 名 和 可 选 参 数 。 

请 求 行 中 的 version 字 段 表 明 该 请 求 遵循 的 HITP 版 本 。HTTP/1.0 是 于 1996 年 发 布 的 老 版 本 。 
HTTP/1.1 定 义 了 一 些 附 加 报头 ， 支 持 缓冲 和 安全 等 高 级 特性 ， 还 允许 客户 端 和 服务 器 在 同一 条 持久 
连接 (persistent connection) 上 执行 多 个 事务 ， 是 目前 被 广泛 应 用 的 标准 。 实 际 上 ， 两 个 版 本 是 互相 兼 
容 的 ， 因 为 HTTP/1.0 的 客户 端 和 服务 器 会 简单 地 忽略 HTTP/1.1 的 报头 。 

上 述 代码 中 ， 第 5 行 的 请 求 行 “GET /HTTP/1.1” 要 求 服务 器 取出 并 返回 HTML 文 件 /index.html。 
请 求 报头 为 服务 器 提供 了 额外 的 信息 ， 例 如 浏览 器 的 商标 名 ， 或 者 浏览 器 理解 的 MIME 类 型 。 请 求 
报头 的 格式 为 : <header name>: <header data>。 

本 例 中 使 用 HOST 报头 (第 6 行 ), 它 是 HTTP/1.1 请 求 所 必需 的 , 但 在 HITP/1.0 请 求 中 不 需要 。 
它 指定 浏览 器 欲 访问 的 Web 服务 器 的 域名 (或 中 地 址 ) 和 端口 号 ， 这 里 应 为 “HOST:www.baidu. 
com:80”， 由 于 80 是 Web 服务 器 的 默认 端口 ， 因 此 端口 号 可 省 去 。 代 理 缓存 (proxy cache) 会 使 用 
HOST 报头 ， 代 理 缓存 有 时 作为 浏览 器 和 管理 被 请 求 文件 的 原始 服务 器 (origin server) 的 中 介 。 客 户 
端 和 原始 服务 器 之 间 可 以 有 多 个 代理 ， 形 成 所 谓 的 代理 链 (proxy chain)。HOST 报头 中 的 数据 指示 了 
原始 服务 器 的 域名 , 使 得 代理 链 中 的 代理 能 够 判断 它 是 否 可 以 在 本 地 缓存 中 拥有 被 请 求 内 容 的 副本 。 

继续 上 面 的 示例 ， 第 7 行 的 空 文本 行 (通过 键入 回 车 键 生成 终止 报头 ， 并 指示 服务 器 发 送 被 请 
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求 的 HTML 文件 。 需 要 注意 的 是 ，HTTP 请 求 行 的 文本 一 般 都 大 写 。 
2. HTTP 响应 


HTTP 响应 和 HTTP 请 求 相似 ， 具 体 组 成 为 : 一 个 响应 行 (第 8 行 )， 后 面 跟着 零 个 或 多 个 响应 
报头 (第 9~14 行 )， 再 跟 一 个 终止 报头 的 空 行 (第 15 行 )， 后 面 是 响应 主体 (第 16~19 行 )， 响 应 主体 通 
常 是 可 在 浏览 器 中 展示 出 来 的 内 容 ， 如 HIML 网 页 。 响 应 行 的 形式 是 : 

<version> <status code> <status message> 

版 本 (version) 字 段 描述 的 是 响应 遵循 的 HITP 版 本 ; 状态 码 (status code) 是 一 个 三 位 的 正 整 数 ， 
指明 对 请 求 的 处 理 ; 状态 消息 (status message) 给 出 与 错误 代码 对 应 的 描述 。 表 8-3 中 列 出 了 一 些 常见 
的 状态 码 及 其 含义 。 这 里 的 响应 行 “HTTP/1.1 200 OK ”表示 请 求 处 理 无 误 ， 响 应 遵循 HITP 1.1 规范 。 


表 8-3 一 些 常见 的 HTTP 状态 码 


状态 代码 描述 
200 处 理 请 求 正确 
301 内 容 已 迁移 到 位 置 头 中 指明 的 主机 
400 服务 器 不 能 理解 请 求 
403 服务 器 无 权 处 理 所 请 求 的 文件 
404 服务 器 找 不 到 所 请 求 的 文件 
sol 服务 器 不 支持 请 求 方法 
505 服务 器 不 支持 请 求 版 本 


第 9~14 行 的 响应 报头 提供 关于 响应 的 附加 信息 。 其 中 ,两 个 最 重要 的 报头 是 : Content-Type( 第 
10 行 )， 它 告诉 客户 端 响应 主体 中 内 容 的 MIME 类 型 ， 以 及 Content-Length( 第 11 行 )， 用 来 指示 响 
应 主体 的 字 节 大 小 。 

第 15 行 是 终止 响应 报头 的 空 文本 行 ， 其 后 跟着 响应 主体 ， 响 应 主体 中 包含 被 请 求 的 内 容 。 


EE 小 型 Web 服务 器 : weblet.c 


本 节 通 过 剖析 功能 完整 且 简 洁 的 Web 服务 器 weblet.c 来 展示 Web 服务 器 的 结构 和 基本 开发 方 
法 ， 该 程序 也 是 前 面 讲 过 的 进程 控制 、UNIXIO、 套 接 字 接 口 和 HITP 等 内 容 的 应 用 案例 。webletc 
实现 了 Web 服务 器 最 常用 的 静态 网 页 和 动态 网 页 功能 ， 动 态 网 页 使 用 了 CGI 技术 。 由 于 代码 简短 ， 
这 里 没有 考虑 实际 服务 器 所 需 的 功能 性 、 健 壮 性 和 安全 性 等 特性 。 


8.7.1 weblet 的 主 程序 


先 给 出 weblet.c 的 主 程序 。 由 于 weblet 是 一 个 迭代 服务 器 ， 它 在 命令 行 中 给 出 的 端口 上 监听 连 
接 请 求 。 在 通过 调用 open_listen_sock 函数 (第 26 行 ) 打 开 一 个 监听 套 接 字 以 后 ，weblet 利用 循环 不 
断 地 接收 连接 请 求 (第 29 行 )， 调 用 process_trans 函数 处 理 HITP 事务 (第 30 行 )， 然 后 关闭 连接 (第 
31 行 )。 
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/*weblet 主 程序 ， 位 于 weblet.c 文件 中 所 
#include "wrapperh" 


% 

Void process_trans(int fd); 

4 Void read_requesthdrs(rio ts#rmp): 

5 int is_static(char *uri); 

6 void parse_static_uri(char *uri, char *filename):; 

void parse_dynamic uri(char *uri, char *filename, char *cgiargs): 
8 Void feed_static(int fd, char *filename, int filesize): 

9 Void get filetype(char *filename, char *filetype): 

10 void feed_dynamic(int fd, char *filename, char *cgiargs): 

11 Void error_request(int fd, char *cause, char *ermum 


12 char *shortmsg, char *description); 

13 

14 int main(int argc, char **argv) 

15 U 

16 int listen_sock, conn_sock, port clientlen: 

和 7 struct sockaddr in clientaddr: 

18 

19 * Check command line args */ 

20 站 (argc 2){ 

21 fprintfstderr "usage: %s <port>\n", argv[0]): 
必 exit(1): 

23 } 

24 port = atoi(argv[1)): 

25 

26 listen_sock = open_listen_sock(port): 

27 while (1) { 

28 clientlen = sizeoftclientadd?); 

29 conn_sock = accept(listen_sock, (SA *)&clientaddr, &clientlen): 
30 Process_trans(conn sock); * process HTTP transaction */ 
31 close(conn_sock); 

32 

33 } 


8.7.2 ”HTTP 事务 处 理 

下 面 给 出 weblet 的 HITP 事务 函数 process_trans 的 源 代 码 。 该 函数 要 做 的 是 首先 从 网 络 连接 中 
读 出 浏览 器 发 送 过 来 的 请 求 行 ， 然 后 解析 请 求 行 ， 最 后 判断 是 请 求 静态 网 页 还 是 动态 网 页 ， 并 调用 
不 同 的 函数 以 提供 相应 的 网 页 内 容 。 

/*weblet 事务 处 理 函数 process_trans 的 源 代码 ， 位 于 webletc 中 */ 


Void process_trans(int fd) 
{ 
int static flag: 
struct stat sbuf: 
char buf{[ MAXLINE], method[MAXLINE]. uri[MAXLINE]. version[MAXLINE]: 


ww- 
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6 char filename[MAXLINE]. csgiargs[MAXLINE]: 

. Tio trio; 

8 

9 * read request line and headers */ 

10 Tio_readinitb(&rio. fd): 

11 Tio_readlineb(&rio.buf MAXLINE); 

了 2 sscanf(buf., "%%s %s %s", method, uri version): 

13 f(strcasecmp(method, "GET")) { 

14 error request(fd, method, "501", "Not Implemented", 
15 "weblet does not implement this method"): 
16 Tetum; 

7 } 

18 read _requesthdrs(&rio): 

19 

20 static_flag=is_static(uri); 

wh ifstatic_ flag) 

22 parse_static_uri(uri, flename): 

23 else 

24 parse_dynamic_uri(uri, filename, cgiargs); 

25 

26 if (stat(filename, &sbuf) <0) { 

27 error_request(fd, filename, "404" "Not found", 

28 "weblet could not find this file"); 

29 Tetum:; 

30 } 

31 

32 if(static flag) { /* feed static content */ 

33 if(!(S_ISREG(sbuf'st_ mode)) | !(S_IRUSR & sbufst mode)) { 
34 error_request(fd, filename. "403", "Forbidden", 
35 "weblet is not permtted to read the file"): 

36 Tetum: 

37 } 

38 feed_static(fd, filename, sbuf st_size): 

39 } 

40 else { /* feed dynamic content */ 

41 if(!(S_ISREG(sbuf'st_ mode)) | !(S_IXUSR & sbufst mode)) { 
42 error_request(fd., filename. "403". "Forbidden", 
43 "weblet could not run the CGI program"): 

44 retum; 

45 } 

46 feed_dynamic(fd, filename. cgiargs): 

47 } 

48 证 

49 

50 int is_static(char *uri) 

51 { 

52 if (!strstr(uri, "cgi-bin")) 

53 Tetum 1: 
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54 else 
55 Tetum 0; 
56 } 


我 们 通过 具体 数据 来 分 析 程 序 的 执行 流程 ， 假 设 客户 端 发 送 的 请 求 行 为 “GET 
/cgi-bin/add?2017&523808 HTTP/1.0rmwmn”， 实 际 上 ，GET 请 求 行 后 跟 一 个 结束 请 求 报 头 的 空 行 。 
具体 执行 过 程 为 。 

第 10 行 : 用 表示 网 络 连接 套 接 字 的 文件 描述 符 亿 初始 化 rio 文件 及 缓冲 区 。 

第 11 行 : 调用 rio readlineb 函 数 , 从 网 络 连接 描述 符 乌 中 读 出 一 个 文本 行 “GET /cgi-bin/add?2017& 
523808 HTTP/1.0”， 复 制 到 buf 缓 冲 区 。 

第 12 行 : 调用 格式 输入 函数 sscanf， 从 保存 在 buf 中 的 请 求 行 中 分 离 出 method、uri、version 
三 个 部 分 ， 分 离 时 以 空格 为 分 隔 字符 。 对 于 前 面 的 请 求 行 ， 可 得 到 method 为 GET，ur 为 
/cgi-bin/add?2017&523808，version 为 HTTP/1.0。 

第 13 行 : 判断 请 求 行 是 否 使 用 GET 方法 。 

第 18 行 : 调用 read_requesthdrs 函数 以 读 取 其 他 请 求 报头 ， 由 于 客户 端 并 没有 发 送 其 他 请 求 报 
头 ， 因 此 实际 上 是 空 操作 。 

第 20 行 : 根据 ui 中 是 否 包含 字符 串 “CGI” 来 判断 请 求 的 是 静态 内 容 还 是 动态 内 容 。 

第 21~25 行 : 分 别 调用 parse_static_uri 和 parse_dynamic_ uri 函数 来 解析 静态 网 页 请 求 和 动态 网 
页 请 求 。 如 果 是 动态 网 页 请 求 ， 则 从 ui 中 提取 文件 名 和 CGI 参数 字符 串 ， 对 于 前 面 的 uri， 可 得 到 
filename 为 “/cgi-bin/add”，cgiargs 为 “2017&523808”。 如 果 是 静态 网 页 请 求 ， 则 根据 需要 补充 
uri 后 级 中 的 路 径 和 默认 文件 名 ， 然 后 提取 文件 名 。 

第 32~39 行 : 如 果 请 求 静态 内 容 ， 就 判断 所 请 求 的 文件 是 否 存在 以 及 是 否 有 读 权限 (第 33 行 )。 
如 果 可 访问 ， 则 调用 feed _static 函数 ， 将 静态 网 页 文件 传送 给 客户 端 。 

第 41~46 行 : 如 果 请 求 动态 内 容 ， 也 判断 所 请 求 的 文件 是 否 存在 ， 并 且 是 否 有 执行 权限 (第 41 
行 )。 如 果 成 立 ， 则 调用 feed_dynamic 函数 ， 将 动态 网 页 文件 传送 给 客户 端 。 

process_ trans 函数 考虑 了 执行 过 程 中 的 异常 情况 ， 当 未 采用 GET 方法 、 请 求 的 文件 不 存在 或 没 
有 相应 权限 时 ， 都 会 调用 error_page 函数 ， 返 回 错误 提示 给 客户 端 (第 13~17 和 第 26~30 行 )。 


8.7.3 ”生成 错误 提示 页 面 


weblet 实现 了 对 一 些 简单 错误 的 处 理 ， 当 未 采用 GET 方法 、 请 求 的 文件 不 存在 或 没有 相应 权限 
时 ， 都 会 报告 给 客户 端 。weblet 的 错误 处 理 函 数 是 error_request， 它 产生 一 个 HTTP 响应 到 客户 端 ， 
该 函数 在 响应 行 中 包含 相应 的 状态 码 和 状态 消息 , 响应 主体 中 包含 一 个 HTML 文件 , 向 浏览 器 用 户 
解释 这 个 错误 。 由 于 HTTP 协议 要 求 通过 响应 指明 主体 中 内 容 的 大 小 和 类 型 ， 因 此 我 们 选择 创建 
HIML 内 容 为 一 个 字符 串 ， 以 方便 计算 其 大 小 (如 下 代码 中 的 第 18 行 )。 


/*weblet 对 错误 请 求 的 处 理 函 数 emor request 返回 一 条 出 错 消息 ， 位 于 weblet.c 文件 中 */ 
void error_request(int fd. char *cause. char *ermum. 
char *shortmsg. char *description) 


1 
2 
3 { 

4 char buf[ MAXLINE]. body[MAXBUF]: 
3 

6 


/* Build the HTTP response body */ 
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学 sprintfbody. "<html><title>error request</title>"): 

8 sprintfbody, "%6s<body bgcolor"fifffp">Anm" body): 

六 sprintf{body., "%s%s: %s\r\n", body, ermum. shortmse); 

10 sprintf(body, "%s<p>%s: %s\r\n", body, description, cause); 
11 sprintf(body, "%s<hr><enmi> weblet Web server</em>\r\n", body): 
12 

13 /* send the HTTP response */ 

14 sprintftbuf, "HTTP/1.0 %s %swm", ermum. shortmse): 

15 Tio_writen(fd, buf stlen(buf)); 

16 sprintf(buf, "Content-type: text/html\\n"); 

1 Tio_writen(fd, buf strlen(buf)): 

18 sprintfbuf "Content-length: %d\n\\n", (int)strlen(body)): 
19 Tio_writen(fd, buf strlen(buf)); 

20 Tio_writen(fd, body. strlen(body)): 

21 } 


8.7.4 ”HTTP 额外 请 求 报头 的 读 取 


weblet 调用 rio_readlineb 函数 来 读 取 额 外 请 求 报头 (如 下 代码 中 的 第 5 和 第 8 行 ), 并 打印 这 些 报 
头 (如 下 代码 中 的 第 7 行 )。 终 止 请 求 报头 的 空 文本 行 是 由 回 车 和 换行 符 对 组 成 的 ， 在 第 6 行 检查 。 


/*toggle 读 取 额 外 请 求 报头 的 read_requesthdrs 函数 的 源 代码 ， 位 于 webletc 中 */ 
1 Void read_ requesthdrs(rio t *1p) 
2 { 
3 char buff MAXLINE]: 
4 
5 Tio_readlineb(1p, buf MAXLINE); 
6 while(stremp(buf, "n\n")) { 
printf("%s", buf); 
8 rio_readlineb(1p, buf MAXLINE): 
9 } 
10 Tetum: 
1 } 
8.7.5 URI 解析 


weblet 假设 静态 内 容 的 主 目录 为 当前 目录 ， 默 认 的 文件 名 是 .home.html， 可 执行 文件 所 在 目录 
是 ./cgi-bin， 将 包含 字符 串 “cgi-bin” 的 URI 认为 是 对 动态 内 容 的 请 求 。 

URI 解析 函数 有 两 个 : parse_static_uri 和 parse dynamic uri。parse_static_ ti 函数 (如 下 代码 中 的 
第 1~8 行 ) 解 析 静 态 内 容 请 求 URI， 它 在 ui 前 添加 点 “.”， 将 其 变 成 一 条 相对 路 径 ， 如 果 uri 的 最 
末尾 字符 为 “/”， 则 在 其 后 添加 “home .html”， 最 后 赋值 给 变量 包 ename。 例 如 ， 如 果 urn 为 “/”， 
则 设置 flename 为 “/home.html”; 如 果 ui 为 “htesthtml”， 则 设置 flename 为 “/test.html”。 

parse dynamic ui 函数 (如 下 代码 中 的 第 10-22 行 ) 解 析 动 态 内 容 请 求 URI， 它 将 URI 解析 为 一 
个 文件 名 和 一 个 可 选 的 CGI 参数 字符 串 。 该 函数 首先 找到 字符 “2?” 的 位 置 ， 将 文件 名 和 CGI 参数 
分 开 ， 然 后 在 文件 名 前 添加 “.”， 将 其 转换 为 相对 路 径 名 。 将 文件 名 复制 到 变量 filename， 将 CGI 
参数 字符 串 复制 到 变量 cgiargs。 比 如 ， 若 前 面 解析 出 uni=“/cgi-bin/add?2017&523808”， 则 执行 
parse_dynamic_uri 函数 后 得 到 filename=“./cgi-bin/add”、cgiargs=“2017&523808”。 
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上 # parse_static_uri 和 parse_dynamic_uri 函数 的 源 代 码 ， 位 于 webletc 中 */ 


1 void parse static_ uri(char *uri, char *filename) 
2 { 

3 char *ptr; 

到 strcpy(filename, "."): 

5 strcat(filename, uri); 

6 if (urilstrlen(ur)-1]—") 

J strcat(filename, "home.html"): 
8 } 

9 

10 Void parse_dynamic_uri(char *uri, char *filename, char *cgiargs) 
11 

12 char *ptr: 

13 ptr = index(uri, ?"): 

14 (pi) { 

15 strcpy(cgiargs, ptr+1); 

16 *#ptr= 0" 

Ld } 

18 else 

19 Strcpy(cgiargs ™™): 

20 strepy(filename, "."); 

21 strcat(filename, uri): 


22 } 
8.7.6 ”服务 静态 内 容 


weblet 支持 四 种 不 同类 型 的 静态 内 容 :HTML 文件 、 无 格式 的 文本 文件 ,JPEG 格式 图 片 和 MPEG 
视频 。Web 上 提供 的 绝 大 部 分 静态 内 容 都 是 这 些 类 型 。 

服务 静态 内 容 的 函数 是 feed_static， 该 函数 产生 并 发 送 一 个 HITP 响应 ， 响 应 主体 是 一 个 本 地 
文件 的 内 容 。 有 具体 代码 说 明 如 下 。 

第 7 行 : 调用 get_filetype 函数 ， 根 据 flename 文件 名 后 级 ， 提 取 文 件 类 型 名 到 变量 filetype 中 。 

第 8~12 行 : 发 送 响应 行 和 响应 报头 给 客户 端 ， 最 后 用 一 个 空 行 “rm” 终 止 报头 。 

第 15~18 行 : 将 被 请 求 文件 的 内 容 复制 到 已 连接 描述 符 妃 ， 发 送 响应 主体 。 第 15 行 以 读 方式 
打开 flename， 并 获得 它 的 描述 符 。 在 第 16 行 ， 调 用 mmap 函数 (参看 第 4 章 ) 将 被 请 求 文件 映射 到 
一 个 虚拟 存储 器 区 域 ， 将 文件 srcfd 的 前 flesize 个 字 节 (实际 为 整个 文件 ) 映 射 到 一 个 从 地 址 srcp 开 
始 的 私有 只 读 虚 拟 存储 器 区 域 。 一 旦 将 文件 映射 到 存储 器 ， 其 描述 符 就 再 不 需要 了 ， 所 以 在 第 17 
行 关闭 该 文件 。 第 18 行 向 客户 端 传送 文件 内 容 。rio_writen 函数 拷贝 从 srcp 位 置 开始 的 filesize 个 字 
节 ( 它 们 已 经 被 映射 到 所 请 求 的 文件 ) 到 客户 端的 已 连接 描述 符 。 

第 19 行 : 释放 映射 的 虚拟 存储 器 区 域 ， 避 免 发 生 潜在 的 存储 器 泄漏 。 

让 weblet 实现 静态 网 页 功能 的 feed_statc 函数 的 源 代码 ， 位 于 webletc 中 */ 


村 void feed _static(int fd. char *filename, int filesize) 
2 

3 int srcfd: 

4 char *srcp. filetype[MAXLINE].buffIMAXBUF]: 
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5 

6 /* Send response headers to client */ 
get_filetype(filename, filetype): 

8 sprintf(buf. "HTTP/1.0 200 OK\An"): 

9 sprintf(buf, "%sServer: weblet Web Serverr\n", buf): 
10 sprintf(buf, "%sContent-length: %d\r\n", buf filesize): 
11 sprintfbuf "%sContent-type: %s\rnrin", buf filetype): 
12 Tio_writen(fd., buf strlen(buf)): 

13 

14 /* Send response body to client */ 

je) srcfd = open(filename, O_ RDONLY. 0); 

16 srcp = mmap(0., filesize, PROT_ READ. MAP PRIVATE. srcfd, 0): 
17 close(srcfd); 

18 Tio_writen(fd, srcp, filesize); 

19 munmap(srcp, filesize): 

20 } 

21 


22 /* get filetype - derive file type from file name */ 
5 Void get_filetype(char *filename, char *filetype) 


24 { 

25 if(strstr(filename, ".html")) 

26 strepy(filetype, "text/html"): 
27 else if (strstr(filename, ".jpg")) 
28 strepy(filetype, "image/jpeg"): 
29 else if (strstr(filename, ".mpeg")) 
30 strepy(filename, "video/mpeg"): 
31 else 

32 strepy(filetype, "text/html"): 
33 } 


有 ”思考 与 练习 题 8.8 分析 上 面 feed_static 函数 的 源 代码 ， 回 答 下 列 问题 : 

(1) 文件 描述 符 伺 是 指 哪个 文件 或 套 接 字 ? 

(2) 第 18 行 利用 rio_writen 函数 向 伺 写 文件 flename 的 内 容 ， 如 果 改 为 使 用 write 函数 ， 有 何 
不 足 ? 

(3) 第 16 行 采用 mmap 函数 读 出 文件 flename 的 内 容 , 如 果 改 为 调用 read 函数 读 文 件 , 有 何不 足 ? 


8.7.7 ”测试 静态 网 页 功能 


1. 以 浏览 器 为 客户 端 进行 测试 
现在 测试 weblet 的 静态 网 页 服务 功能 。 创 建 一 个 测试 用 的 静态 网 页 test.htm1， 其 内 容 为 : 


<html> 

<head> 

<title>a simple page for testing weblet</title> 
<head> 

<body> 

Hello World 

</body> 

</html> 


和 :>4 


第 8 章 网 络 编 程 


将 其 复制 到 weblet 所 在 目录 ， 启 动 weblet: 


$gcc -0 weblet webletc -L. -mrapper 
S$ .weblet 12345 


在 浏览 器 中 输入 静态 网 页 的 路 径 ， 执 行 后 得 到 的 输出 如 图 8-9 所 示 。 


asimple page for testing tiny - Mozilla Firefox 


History Bookmarks TT Help 


入 :cc 会 [加 [http://localhost:12345/testhtml 


加 asimple page fortestingtiny 路 
Hello World 


图 8-9 ”测试 静态 网 页 功能 
这 表明 weblet 能 正确 提供 静态 网 页 功能 。 
2. 以 telnet 为 客户 端 程序 进行 测试 
启动 weblet 后 ， 在 telnet 终端 窗口 中 输入 的 telnet 命令 和 对 应 的 输出 如 下 : 


Stelnet localhost 12345 
Trying ::1... 

Trying 127.0.0.1... 
Connected to localhost. 
Escape character is “J'. 
GET /test.htiml HTTP/1.0 


HTTP/1.0 200 OK 

Server: weblet Web Server 
Content-length: 94 
Content-type: text/html 


<title>a simple page for testing weblet</title> 

<head> 

<body> 

Hello World 

</body> 

</html> 

Connection closed by foreign host. 
可 以 看 出 ，weblet 按照 HTTP 事务 规范 产生 了 输出 。 
多 思考 与 练习 题 8.9 阅读 8.7.6 节 中 feed _static 函数 的 源 代 码 ， 修 改 第 8~12 行 代 码 ， 让 状态 码 、 
文件 大 小 、 文件 类 型 、 写 入 和 亿 的 buf 长度 与 实际 不 同 , 通过 浏览 器 和 telnet 命令 , 请 求 网 页 testhtml， 
观察 服务 器 响应 和 浏览 器 显示 结果 ， 并 给 出 解释 。 


8.7.8 服务 动态 内 容 
对 动态 内 容 进 行 请 求 时 ，weblet 创建 一 个 子 进程 并 在 子 进 程 的 上 下 文中 运行 一 个 CGI 程序， 从 
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而 提供 动态 内 容 。 如 下 代码 中 的 feed_dynamic 函数 首先 向 客户 端 发 送 一 个 表示 成 功 的 响应 行 ， 同 时 
还 包括 带 有 信息 的 Server 报头 ，CGI 程序 负责 发 送 响 应 的 剩余 部 分 。feed_dynamic 函数 利用 无 名 管 
道 将 CGI 参数 的 值 传 给 cgi 子 进程 。 


/*weblet 实现 服务 动态 网 页 功能 的 函数 feed_dynamic 的 源 代码 ， 位 于 webletc 中 */ 


void feed_dynamic(int fd, char *filename, char *cgiargs) 
{ 

char buf[ MAXLINE], *emptylist] = { NULL }: 

int pfd[2]: 


/* Retum first part of HTTP response */ 
sprintftbuf "HTTP/1.0 200 OK\n"); 
Tio_writen(fd, buf strlen(buf)); 

sprintftbuf "Server: weblet Web Serverm\n"): 
Tio_writen(fd, buf strlen(buf)); 


Pipe(pfd); 
if (fork0 = 0) { 让 child#/ 
close(pfd[1]): 
dup2(pfd[0],STDIN_FILENO):; 
dup2(fd, STDOUT FILENO): /* Redirect stdout to client */ 


execve(filename., emptylist environ); & /* Run CGIprogram #/ 
} 


close(pfd[OD):; 

write(pfd[1], cgiargs, stlen(cgiargs)+1); 

wait(NULL); /* Parent waits for and reaps child */ 
close(pfa[1]); 

} 


第 6~10 行 : 发 送 一 个 表示 成 功 的 响应 行 和 Server 报头 给 客户 端 。 

第 12 和 第 13 行 : 创建 无 名 管道 ， 派 生 一 个 子 进 程 。 

第 14~17 行 : 子 进程 关闭 管道 写 端 pfd[1]， 调 用 dup2 函数 ， 将 管道 读 端 pfd[0] 重 定向 为 子 进程 
的 标准 输入 , 将 与 客户 端的 已 连接 套 接 字 描述 符 亿 重 定向 为 子 进程 的 标准 输入 , 然后 加 载 cgi 程序 。 
这 样 ， 子 进程 cgi 程序 就 可 从 管道 读 入 CGI 参数 ， 将 信息 写 入 网 络 连接 ， 也 就 是 发 送 给 客户 端 。 

第 20-23 行 : 父 进程 关闭 管道 读 端 后 ， 将 cgiargs 中 保存 的 CGI 参数 写 入 管道 ， 之 后 调用 wait 
函数 ， 等 待 cgi 子 进程 结束 并 回收 ， 最 后 关闭 管道 写 端 。 


8.7.9 实现 CGI 程序 


这 号 


有 以 将 两 个 数 相 加 的 CGI 程序 add.c 为 例 ， 介 绍 CGI 程序 的 编写 方法 。 代 码 如 下 : 


人 # 整 数 求 和 CGI 程序 的 源 代 码 ， 位 于 addc 中 */ 


#include “wrapper.h" 


int main(void) { 
char *buf *p: 
char content[MAXLINE]: 
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6 intn1=0, n2=0; 

7 

8 :Extract the two arguments from standard input */ 

9 scanf("%d&%d", &nl., &n2): 

10 

11 /* Make the response body */ 

这 sprintf(content, "Welcome to add.com: "); 

13 sprintf(content, "%sTHE Intemet adderin<p>", content): 
14 sprintf(content, "%sThe answer is: %d + %d = %d\r\n<p>", 
15 content n1, n2, nl + 02): 

16 sprintf(content, "%sThanks for visiting!\r\n", content); 

17 

18 /* Generate the HTTP response */ 

19 Printf("Content-length: %d\\n", strlen(content)):; 

20 Printf("Content-type: text/htmlr n\n"): 

21 Printf("%%s", content); 

22 fflush(stdout); 

23 exit(0); 

24 i 


第 9 行 : 由 于 CGI 参数 已 由 feed_dynamic 写 入 管道 ， 而 管道 读 端 已 经 重 定向 为 CGI 进程 标准 
输入 ， 因 此 只 需要 利用 正常 的 格式 化 读 函 数 即 可 方便 地 从 管道 读 入 参数 值 。 假 设 请 求 行为 “GET 
/cgi-bin/add?2017&523808 HTTP/1.1”， 前 面 已 经 获知 cgiargs 为 2017&523808， 执 行 本 行 代码 后 ， 
得 到 两 个 整 型 参数 的 值 n1=2017、n2=523808。 

第 12~16 行 : 调用 格式 化 输出 函数 sprintf 生成 动态 内 容 ， 作 为 响应 体 ， 存 入 缓冲 区 content。 

第 19-20 行 : 产生 长 度 、 类 型 两 个 响应 头 报 文 ， 并 写 入 标准 输出 ， 实 际 上 是 发 送 给 客户 端 。 

第 21 行 : 将 动态 网 页 内 的 容 发 送 给 客户 端 。 


8.7.10 测试 动态 网 页 功能 


先 编译 weblet.c 和 addc， 产 生 可 执行 程序 weblet 和 add。 需 要 注意 的 是 : weblet 已 经 采取 硬 编 
码 方法 将 其 所 在 目录 设置 成 Web 服务 器 的 根 目录 , 假定 CGI 程序 被 放置 到 cgi-bin 子 目录 中 。 因 此 ， 
add 必须 放置 到 weblet 所 在 目录 的 子 目 录 cgi-bin 中 。 

S$gcc -oO weblet webletc -L. -Wrapper 

$gcc -0 add addc 

S$ mkdir cgi-bin 

$cp add cgi-bin 

然后 ,启动 Web 服务 器 weblet, 端口 号 是 12345， 当 weblet 接收 到 特定 请 求 时 , 将 创建 子 进程 ， 
执行 add 程序 ， 返 回 动态 网 页 。 

§.Aveblet 12345 


接 下 来 打开 浏览 器 ， 输 入 网 址 http://localhost:12345/cgi-bin/add?2017&523808， 打 开 一 个 命令 窗 
口 ， 输 入 telnet localhost 12345 命令 ， 然 后 输入 GET /cgi-bin/add?2017&523808 HTTP/1.0， 测 试 CGI 
程序 add 的 正确 性 。 

浏览 器 的 输出 结果 如 图 8-10 所 示 。 
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Mozilla Firefox 


下 司 | http://localhost:12345/cgi-bin/add?2017&523808 bd q 
所 会 p 9 


立 MostVisited *” 赎 Getting Started 国 LatestHeadlinesv 
回 http://localho...d?2017&523808 号 
Welcome to add.com: THE Internet addition portal. 


The answer is: 2017 + 523808 = 525825 
Thanks for visiting! 
8-10 测试 结果 


可 以 看 到 ,输出 的 第 1 行内 容 来 自 示例 代码 add.c 的 第 12 和 第 13 行 ， 第 2 行内 容 来 自 第 14 和 
第 15 行 ， 第 3 行内 容 来 自 第 16 行 ， 后 面 可 以 看 到 ，add 程序 的 标准 输出 通过 输出 重 定向 写 入 与 浏 
览 器 通信 的 网 络 连接 ， 因 此 最 终 显示 到 浏览 器 上 。 还 要 注意 ，CGI 程序 中 产生 的 输出 换行 ， 需 要 在 
行 尾 增加 “wn” 两 个 字符 ， 才 能 得 到 正确 处 理 。 

使 用 telnet 命令 得 到 的 测试 结果 如 下 : 

Stelnet localhost 12345 

Trying ::1... 

Tiying 127.0.0.1... 

Connected to localhost. 

Escape character is “J'. 

GET /cgi-bin/add?2017¢&:523808 HTIP/1.0 


HTTP/1.0200 OK 

Server: weblet Web Server 
Content-length: 115 
Content-type: text/html 


Welcome to add.com: THE Intemet addition portal. 
<p>The answer is: 2017 + 523808 = 523825 
<p>Thanks for visiting! 
Connection closed by foreign host. 

前 四 行 是 telnet 命令 的 输出 ， 只 要 连接 成 功 都 会 打印 。 输 入 “GET /cgi-bin/adqd?2017&523808 
HTIP/1.0” 后 跟 一 个 空 文本 行 后 ， 得 到 的 输出 来 自 weblet 和 add。 其 中 前 两 行 来 自 weblet。 后 面 六 
行 来 自 于 add。 其 中 ，“Content-length: 115” 来 自 add 程序 的 第 19 行 ， “Content-type: text/html” 
和 后 面 的 空 行 来 自 add 程序 的 第 20 行 。 这 三 行 是 HITP 协议 标准 规定 的 ，Web 服务 器 在 发 送 网 页 
内 容 前 必须 发 送 给 浏览 器 的 这 两 个 文本 行 ， 浏 览 器 确认 收 到 这 两 行 后 ， 才 会 处 理 其 后 的 网 页 内 容 。 
网 页 内 容 长 度 (Content-length) 字 段 必须 与 其 后 网 页 内 容 的 实际 长 度 一 致 ， 在 这 里 是 115。 紧 接着 的 3 
行 来 自 add 程序 的 第 12~16 行 。 add.c 程序 对 此 给 出 了 清晰 的 注释 。 最 后 一 行 由 telnet 命令 打印 出 来 ， 
表示 weblet 进程 关闭 了 网 络 连 接 ， 一 个 HTTP 事务 已 经 结束 。 

ge 思考 与 练习 题 8.10 ”用 Shell 或 Python 实现 CGI 程序 add， 并 调试 之 。 

旨 思考 与 练习 题 8.11 编写 和 运行 CGI 程序 ， 在 浏览 器 中 显示 指定 ls 命令 的 内 容 ; 编写 CGI 
程序 ， 能 通过 浏览 器 输入 Linux 命令 ， 在 浏览 器 中 显示 命令 输出 。 

好 = * 思 考 与 练习 题 8.12 ”输入 命令 “ /weblet 12345”, 启动 weblet, 用 一 个 Telnet 进程 连接 weblet， 
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并 输入 网 页 浏览 请 求 ,在 该 请 求 处 理 未 完成 前 , 在 浏览 器 的 地 址 栏 中 输入 http: //localhost:12345/ 
test.html， 执 行 后 将 看 到 什么 结果 ， 予 以 解释 。 


8.7.11 关于 Web 服务 器 的 其 他 问题 


1. Web 服务 器 如 何 将 参数 传递 给 CGI 程序 


理论 上 讲 ，Web 服务 器 可 通过 前 面 讲 过 的 管道 、 消 息 队列 、 共 享 内 存 等 任何 方法 将 数据 传送 给 
CGI 程序 , 这 里 介绍 的 将 无 名 管道 重 定向 为 标准 输入 是 一 种 比较 自然 、 方便 的 方法 。 在 实际 应 用 中 ， 
还 有 一 些 其 他 的 用 于 给 CGI 程序 传递 数据 的 方法 可 以 运用 ， 如 使 用 UNIX/Linux 环境 变量 ， 在 加 载 
CGI 程序 前 ， 将 子 进 程 的 各 类 信息 写 入 环境 变量 ，CGI 程序 就 可 直接 从 环境 变量 读 出 不 同类 型 的 信 
息 。 表 8-4 是 CGI 定义 的 常用 环境 变量 。 


表 8-4 ”常用 CGI 环境 变量 


环境 变量 描述 
QUERY _ STRING 程序 参数 
SERVER_PORT 父 进程 侦 听 端口 
REQUEST_ METHOD GET 或 POST 
REMOTE_ HOST 客户 端的 域名 
REMOTE_ADDR 客户 端的 他 地址 
CONTENT TYPE 请 求 体 的 MIME 类 型 ( 仅 针对 POST 方法 ) 
CONTENT LENGTH 请 求 体 的 长 度 ( 仅 针对 POST 方法 ) 


旨 ” 思考 与 练习 题 8.13 ”改写 weblet 的 feed_dynamic 函数 和 CGI 程序 add.c， 改 为 由 环境 变量 
传递 CGI 参数 。 


2. 如 何 处 理 过 早 关闭 的 连接 


构造 长 时 间 运 行 而 不 崩溃 的 健壮 Web 服务 器 时 ， 有 很 多 需要 考虑 的 细节 。 例如， 如 果 服 务 器 写 
一 个 已 经 被 客户 端 关闭 的 连接 (比如 ， 因 为 在 浏览 器 中 单 击 了 “Stop” 按 钮 )， 那么 第 一 次 这 样 写 会 正 
常 返回 , 但 是 第 二 次 写 就 会 引起 发 送 SIGPIPE 信号 ， 这 个 信号 的 默认 行为 就 是 终止 这 个 进程 。 如果 
捕获 或 忽略 SIGPIPE 信号 ， 那么 第 二 次 写 会 返回 - 1， 并 将 ermo 设置 为 EPIPE。strerr 和 perror 函数 
将 EPIPE 错误 报告 为 “Broken pipe”， 处 理 这 些 错 误 是 很 复杂 的 。 健 壮 的 服务 器 必须 能 够 捕获 这 些 
SIGPIPE 信和 号， 并且 检查 write 函数 调用 是 否 有 EPIPE 错误 。 


本 章 小 结 


网 络 通信 是 进程 问 通信 的 自然 延伸 ， 在 Linux 系统 编程 课程 中 讲述 网 络 通信 编程 ， 也 是 一 种 不 
错 的 尝试 。 由 于 不 是 计算 机 网 络 课程 ， 不 宜 系统 地 讲述 计算 机 网 络 知识 体系 ， 仅 在 简要 介绍 网 络 通 
信 的 必要 概念 的 基础 上 ， 引 入 套 接 字 接 口 和 网 络 通信 编程 方法 ， 这 样 做 学 生 是 可 以 接受 的 ， 需 要 的 
学 时 也 不 多 。 

网 络 应 用 大 多 基于 客户 端 /服务 器 模型 ， 一 般 由 一 个 服务 器 和 一 个 或 多 个 客户 端 构 成 。 服 务 器 管 
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理 资源 ， 以 某 种 方式 操作 资源 ， 为 客户 端 提 供 服务 。 客 户 端 /服务 器 模型 的 基本 操作 是 客户 端 / 服 务 
器 事务 ， 由 客户 端 请 求 和 跟随 其 后 的 服务 器 响应 组 成 。 

客户 端 和 服务 器 使 用 套 接 字 接 口 建立 连接 。 套 接 字 是 连接 的 一 个 端点 ， 以 文件 描述 符 形式 提供 
给 应 用 程序 。 套 接 字 接口 提供 了 打开 和 关闭 套 接 字 描述 符 的 函数 。 客 户 端 和 服务 器 通过 读 写 这 些 描 
述 符 来 实现 彼此 间 通 信 。 

Web 服务 器 使 用 HTTP 协议 与 客户 端 彼 此 通信 ， 客 户 端 一 般 为 浏览 器 ， 也 可 以 是 支持 HITP 协 
议 规范 的 普通 应 用 程序 。 浏 览 器 向 服务 器 请 求 静 态 或 动态 内 容 。 对 静态 内 容 的 请 求 ， 服 务 器 直接 将 
指定 的 磁盘 文件 内 容 提供 给 客户 端 ， 对 动态 内 容 的 请 求 ， 服 务 器 运行 一 个 程序 并 将 其 输出 返回 给 客 
户 端 。CGI 标准 提供 了 一 组 规则 ， 以 管理 客户 端 如 何 将 程序 参数 传递 给 服务 器 ， 服 务 器 如 何 将 这 些 
参数 以 及 其 他 信息 传递 给 子 进程 ， 以 及 子 进程 如 何 将 它 的 输出 发 送 回 客户 端 。 

本 章 以 toggle 服务 器 和 简单 Web 服务 器 为 例 介绍 网 络 应 用 开发 方法 , 虽然 程序 比较 简单 , 但 能 
展现 网 络 通信 编程 的 实质 ， 学 生 在 分 析 案例 后 ， 很 容易 模仿 写 出 较为 简单 的 网 络 通信 程序 。 


课 后 作业 


和 ”思考 与 练习 题 8.14 修改 toggle 服务 器 代码 ， 使 之 每 次 向 客户 端 回 送 文本 行 时 ， 后 接 当 前 
系统 时 间 。 
粥 思考 与 练习 题 8.15 

A. 使 用 浏览 器 向 weblet 申请 浏览 一 个 静态 网 页 ， 并 将 输出 保存 到 一 个 文件 中 。 

B. 检查 weblet 输出 ， 确 定 浏 览 器 使 用 的 HITP 版 本 。 

从 www.Ifc-editor.org/rfc.html 获得 RFC 2616， 参 考 其 中 的 HTTP/L1 标准 ， 获 取 浏 览 器 的 HITP 
请 求 中 每 个 报头 的 含义 。 
多 思考 与 练习 题 8.16 修改 weblet， 使 用 SIGCHLD 信号 处 理 程序 回收 CGI 子 进 程 。 
虽 ” 思考 与 练习 题 8.17 修改 weblet 中 的 静态 网 页 请 求 服务 代码 ， 使 用 malloc、rio readn 和 
ri_writen 代替 内 存 映射 mmap 和 rio_writen， 将 被 请 求 文件 的 内 容 发 送 到 已 连接 描述 符 。 
条 ”思考 与 练习 题 8.18 修改 weblet 中 的 动态 网 页 请 求 服务 代码 ，weblet 采用 环境 变量 将 CGI 
参数 传递 给 CGI 程序 。 
多 * 思 考 与 练习 题 8.19 扩展 weblet， 以 支持 HITP HEAD 方法 。 使 用 telnet 命令 为 Web 客户 
端 验证 该 功能 。 
和 * 思 考 与 练习 题 8.20 ”扩展 weblet, 以 支持 浏览 器 用 HTTP POST 方法 请 求 动态 内 容 , 创建 一 
个 CGI 测试 程序 ， 用 浏览 器 验证 该 功能 。 
惠 * 思 考 与 练习 题 8.21 修改 weblet, 以 恰当 地 处 理 在 write 函数 试图 写 一 个 过 早 关闭 的 连接 时 
发 生 的 SIGPIPE 信号 和 EPIPE 错误 ， 而 不 是 终止 程序 。 


第 9 章 
并 发 网 络 通信 编程 实例 


第 8 章 介绍 的 迭代 式 网 络 服务 器 很 难 用 于 实际 应 用 中 , 因为 它们 一 次 只 能 为 一 个 客户 端 提供 服 
务 。 一 个 慢 速 的 客户 端 可 能 会 导致 服务 器 拒绝 为 所 有 其 他 客户 端 服务 。 真 正 的 服务 器 往往 需要 每 秒 
能 为 成 百 上 千 个 客户 端 提供 服务 。 改 进 方法 是 设计 成 并 发 网 络 服务 器 ， 让 它 创建 一 个 单独 的 逻辑 流 
以 服务 每 个 客户 端 。 使 用 应 用 级 并 发 的 应 用 程序 称 为 并 发 程序 (concurrent program)。 操 作 系 统 提供 
了 三 种 基本 的 构造 并 发 程序 的 方法 :(1) 多 进程 。 用 这 种 方法 ， 每 个 逻辑 控制 流 都 是 一 个 进程 ， 由 内 
核 调度 和 维护 ，(2)VO 多 路 复 用 。 在 这 种 形式 的 并 发 编程 中 ， 应 用 程序 在 一 个 进程 的 上 下 文中 显 式 
地 调度 其 逻辑 流 , 实现 IO 与 CPU 的 并 发 操作 ; (3) 多 线程 。 线 程 是 运行 在 单一 进程 上 下 文中 的 逻辑 
流 ， 由 内 核 调度 。 本 章 介绍 这 三 种 不 同 的 并 发 编程 技术 ， 继 续 使 用 第 8 章 的 示例 程序 展开 讨论 。 


本 章 学 习 目标 : 
e 理解 基于 多 进程 、IO 多 路 复 用 、 多 线程 、 预 线程 化 的 并 发 网 络 服务 器 的 基本 结构 
e 掌握 基于 多 进程 、 多 线程 、 预 线程 化 方法 编写 并 发 网 络 服务 器 


I 基于 多 进程 的 并 发 编程 


构造 并 发 程序 的 最 直观 方法 就 是 多 进程 ,主要 函数 有 fork、exec 和 waitpid 等 。 一 种 比较 自然 的 
方法 是 在 父 进程 中 接收 客户 端 连 接 请 求 后 ， 创 建 一 个 新 的 子 进程 来 为 每 个 客户 端 提供 服务 。 下 面 是 
某 种 多 进程 并 发 服务 器 的 工作 流程 。 

假设 现在 有 两 个 客户 端 和 一 个 服务 器 ， 该 服务 器 正在 描述 符 3 上 监听 连接 请 求 。 

第 1 步 (参见 图 9-1): 服务 器 接收 到 来 自 客户 端 1 的 连接 请 求 ， 返 回 一 个 已 连接 描述 符 
conn sock=4。 

第 2 步 (参见 图 9-2): 在 接收 连接 请 求 之 后 ， 服 务 器 派生 一 个 子 进程 来 处 理 请 求 ， 这 个 子 进程 获 
得 服务 器 描述 符 表 的 副本 。 由 于 父 进程 不 再 需要 与 客户 端 1 通信 ， 子 进程 不 需要 侦 听 连接 请 求 ， 相 
应 的 描述 符 也 就 不 需要 了 ,因此 父 进 程 可 关闭 已 连接 描述 符 4, 子 进程 关闭 其 副本 中 的 监听 描述 符 3， 
以 防 内 存 泄漏 ， 专 门 忙于 为 客户 端 提供 服务 。 


中 、 接 请 求 


pi ~~~ listen sock=3 


国 服务 器 client_sock conn_sock=4 
~ Rr listen sock=3 
conn_ sock=4 口 口 


client sock 
client sock 父 进程 


图 9-1 第 1 步 ， 服 务 器 接收 客户 端的 连接 请 求 图 9-2 第 2 步 : 服务 器 派生 一 个 子 进程 来 为 这 个 客户 端 服务 

第 3 步 ( 参 见 图 9-3): 假设 父 进 程 为 客户 端 1 创建 子 进程 之 后 , 又 接收 另 一 客户 端 2 的 连接 请 求 ， 
并 返回 一 个 新 的 已 连接 描述 符 (比如 描述 符 5)。 

第 4 步 (参见 图 9-4): 父 进程 派生 另 一 个 子 进程 ， 继 承 已 连接 描述 符 5， 为 客户 端 2 提供 服务 。 
此 后 , 父 进程 继续 等 待 来 自 其 他 客户 端的 连接 请 求 ， 而 两 个 子 进 程 并 发 地 为 已 连接 客户 端 提供 服务 。 


数据 传送 


client sock conn_sock=4 
连接 请 求 listen_sock=3 
conn_sock=5 ”人 父 进程 
9-3 第 3 步 : 服务 器 接收 另 一 个 连接 请 求 9-4 第 4 步 : 服务 器 派生 另 一 个 子 进程 来 为 新 的 
客户 端 服务 
下 面 展 示 了 基于 多 进程 的 并 发 toggle 服务 器 togglesp.c 的 源 代码 。 第 28 行 调用 的 toggle 函数 来 
自 8.5 节 中 的 togglec.c。 由 于 父 进 程 还 要 继续 侦 听 连接 请 求 ， 不 能 调用 wait 函数 等 待 子 进程 终止， 
因此 安排 一 个 SIGCHLD 信号 处 理 程序 来 回收 僵尸 xzombie) 子 进程 (第 4-8 行 )。 该 处 理 程序 利用 while 
循环 可 一 次 回收 多 个 终止 子 进程 ， 这 样 即使 在 SIGCHLD 信号 处 理 期 间 有 子 进程 终止 或 SIGCHLD 
信号 丢失 ， 这 些 僵尸 子 进程 也 不 会 被 遗漏 。 
人 # 基于 多 进程 的 并 发 toggle 服务 器 。 代 码 位 于 togglesp.c 中 */ 
人 # 父 进 程 派生 一 个 子 进程 来 处 理 每 个 新 的 连接 请 求 */ 


client_sock 


1 #include "wrapper.h" 

2 Void toggle(int conn_sock): 

和 

4 void sigchld_handler(int sig) 

5 { 

6 while (waitpid(-1.0. WNOHANG) > 0): 
和 Teturn: 

8 } 

号 

10 int main(int argc. char **#argvV) 

11 { 

12 int listen_sock. conn_sock. port: 

13 socklen t clientlen=sizeoflstruct sockaddr in): 
14 struct sockaddr in clientaddr: 

25 

16 这 (argc !=2){ 
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党 fprintflstderr "usage: %s <port>\n", argv[0]): 

18 exit(1): 

19 } 

20 port = atoilargv[1]): 

2 

22 signal(SIGCHLD. sigchld handler): 

| listen_sock = open listen_sock(port): 

24 while (1) { 

25 conn sock = accept(listen_sock, (SA *) &clientaddr, &clientlen): 

26 (fork0 = 0){ 

Sy close(listen_sock); /* Child process closes its listening socket */ 
28 toggle(conn sock); /* Child process services client */ 

29 close(conn sock): /* Child process closes connection with client */ 
30 exit(0); /* Child process exits */ 

3Y } 

32 close(conn sock): /* Parent closes connected socket (important!) */ 
33 } 

34 } 

先 编译 服务 器 和 客户 端 程序 : 


Sgcc togglecc togglec -0 togglec - -wrapper 
S$gcc togglesp.c togglec -0 togglesp -L. -Iwrapper 


再 在 三 个 不 同 的 终端 窗口 中 执行 程序 ， 第 一 个 终端 窗口 运行 ogglesp， 第 2 和 第 3 个 终端 窗口 运行 
togglec， 结 果 如 下 。 


终端 窗口 1: 运行 服务 器 终端 窗口 2: 运行 客户 端 终端 窗口 3: 运行 客户 端 
$./togglesp 12345 S$./togglec localhost 12345 S$./togglec localhost 12345 
server received 12 bytes hello world LINUX SYSTEM 

Sserver received 12 bytes HELLO WORLD linux system 


从 运行 结果 可 以 看 出 ，togglesp 可 同时 与 两 个 togglec 通信 ， 是 一 个 多 进程 并 发 服务 的 网 络 服 
务 器 。 

在 父子 进程 间 共 享 状态 信息 的 基本 模型 是 ,共享 打开 文件 表 ， 但 不 共享 用 户 地 址 空间 。 由 于 每 
个 进程 都 有 独立 的 地 址 空间 ， 进 程 间 一 般 不 会 相互 影响 ， 一 个 进程 不 会 因为 出 错 或 误 操作 更 改 另 一 
个 进程 的 变量 ， 系 统 有 较 好 的 可 靠 性 和 安全 性 。 但 另外 ， 独 立地 址 空间 也 使 得 进程 间 共 享 状态 信息 
变 得 麻烦 ， 在 进程 间 交 换 信息 需要 使 用 IPC( 进 程 间 通信 ) 机 制 ， 而 了 PC 机 制 开销 很 高 ， 这 就 使 进程 
间 数 据 共享 变 得 低 效 。 
史 思考 与 练习 题 9.1 在 服务 器 源 代码 togglesp.c 的 第 32 行 ， 父 进程 关闭 已 连接 描述 符 后 ， 子 
进程 仍然 能 够 使 用 该 描述 符 和 客户 端 通信 。 这 是 为 什么 ? 
和 思考 与 练习 题 92 ”如果 删除 代码 togglesp.c 中 用 于 关闭 已 连接 描述 符 的 第 29 行 ， 代 码 仍然 
正确 ， 也 不 会 发 生存 储 器 泄漏 ， 这 是 为 什么 ? 
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在 前 面 的 toggle 服务 器 应 用 中 ， 如 果 要 求 服务 器 既 能 响应 来 自 toggle 客户 端的 连接 请 求 ， 也 能 
对 用 户 从 标准 输入 键入 的 交互 命令 给 予 响应 , 就 属于 这 种 情况 。 服务 器 必须 响应 两 个 互相 独立 的 IO 
事件 :网 络 客户 端 发 起 连接 请 求 ， 以 及 用 户 在 键盘 上 键入 命令 行 。 服 务 器 先 等 待 哪个 事件 呢 ? 似乎 
选择 谁 都 不 能 解决 问题 。 如 果 在 accept 函数 中 等 待 一 个 连接 请 求 ， 就 不 能 响应 输入 的 命令 。 如 果 执 
行 read 函数 ， 等 待 一 条 输入 命令 ， 就 不 能 响应 任何 连接 请 求 。 

如 果 系 统 能 提供 某 种 机 制 ， 让 程序 同时 等 待 两 种 或 多 种 事件 发 生 ， 任 何 一 种 事件 发 生 都 能 立即 
进行 处 理 ， 那 么 即便 不 采用 多 进程 和 多 线程 方法 ， 也 能 满足 这 样 的 应 用 需求 。UNIX/Linux 系统 确实 
提供 了 这 么 一 个 机 制 ， 就 是 1O 多 路 复 用 (VO multiplexing) 技 术 ， 应 用 程序 调用 select 函数 ， 可 同时 
等 待 多 个 IO 事件 (每 个 IO 事件 源 可 看 成 一 个 文件 描述 符 )， 任 意 IO 事件 发 生 或 等 待 超 时 ， 都 会 将 
控制 返回 给 应 用 程序 。 比 如 select 函数 可 以 在 发 生 以 下 三 种 事件 之 一 时 返回 : 

。 当 集 合 {0, 4 中 的 任意 文件 描述 符 准 备 好 读 时 返回 。 

。 当 集合 {1, 2, 7} 中 的 任意 文件 描述 符 准备 好 写 时 返回 。 

e 等 待 一 个 1O 事件 发 生 的 时 间 超 过 152.13 秒 时 返回 。 

select 函数 有 许多 不 同 的 使 用 场景 ， 这 里 仅 讨论 第 一 种 场景 : 等 待 一 组 描述 符 准备 好 读 。 与 IO 
多 路 复 用 相关 的 主要 函数 或 宏 有 : 

#include <unistd.h> 


#include <sys/types.h> 
int select(int n , fd_set *fdset , NULL , NULL , NULLD): 


返回 值 : 有 数据 可 读 的 读 描述 符 个 数 ， 若 出 错 ， 则 为 -1 。 


FD_ZERO(fd set *fdset): /* Clear all bits in fdset */ 
FD_CLR(int fd , fd_set *fdset): /* Clear bit fd in fdset */ 
FD_SET(int fd , fd_set *fdset): /* Turn on bit fd in fdset */ 
FD_ISSET(Gint fd , fd_set *fdset): /*isbit fd in fdset on? */ 


select 函数 处 理 类 型 为 世 set 的 描述 符 集合 。 逻辑 上 , 我 们 将 描述 符 集合 看 成 一 个 长 度 为 n 的 位 
向 量 : bn - 1,…, bl1,b0。 每 个 位 bk 对 应 于 描述 符 k。 当 且 仅 当 bk=1 时 ， 描 述 符 k 才 表明 是 描述 符 集 
合 的 一 个 元 素 。 我们 主要 用 FD_ZERO、FD_SET、FD_CLR 和 FD ISSET 宏 指令 来 修改 和 检查 描述 
符 集合 。 描 述 符 集合 类 型 的 变量 也 可 以 直接 赋值 。 

前 面 给 出 的 select 函数 声明 仅 用 于 等 待 多 个 读 文件 描述 符 就 绪 ， 因 为 函数 声明 仅 考 虑 前 面 两 个 
参数 : 伺 set 类 型 参数 fdset 是 读 描述 符 集合 ， 整 型 参数 n 是 读 描述 符 集合 的 基数 ， 可 设置 为 当前 最 
大 的 文件 描述 符 。 在 调用 select 函数 时 ， 后 面 三 个 参数 都 设置 为 NULL。select 函数 执行 时 ， 若 读 描 
述 符 集合 中 的 所 有 描述 符 都 无 数据 可 读 ,函数 会 一 直 阻塞 直到 描述 符 有 数据 读 。select 函数 有 一 个 
副作用 ， 它 会 修改 读 描 述 符 集合 fdset。 由 于 这 个 原因 ， 在 每 次 调用 select 函数 后 都 必须 更 新 读 描述 
符 集合 fdset。select 函数 返回 的 值 是 就 绪 的 描述 符 集合 的 基数 。 


| :44 


第 9 章 并 发 网 络 通信 编程 实例 


*9.2.1 利用 I/O 多 路 复 用 等 待 多 种 I/O 事件 


togglessl.c 是 基于 IO 多 路 复 用 同时 等 待 客户 端 连接 请 求 和 键盘 命令 输入 的 一 种 代码 实现 。 


居 使 用 1O 多 路 复 用 的 toggle 服务 器 程序 togglessl.c。 
使 用 select 函数 等 待 监听 描述 符 上 的 连接 请 求 和 标准 输入 中 的 命令 ， 编 译 命令 为 
gcc togglessl.c togglec -0 togglessl -L. -lwrapper*/ 
#include "wrapper.h" 
void toggle(int conn_ sock): 
void read_input (void): 


2 

E 

4 

5 int main(int argc, char **argv) 

6 i 

7 int listen_sock, conn_sock, port: 

8 socklen t clientlen = sizeof(struct sockaddr in): 
9 struct sockaddr in clientaddr: 


10 fd_ set read set, ready_set: 

Wh 

12 if(argc (=2){ 

ia fprintf(stderr, "usage: %s <port>\n", argv[0]): 

14 exit(1); 

15 } 

16 port = atoi(argv[1]): 

1 listen_sock = open listen_sock(port); 

18 

19 FD _ZERO(&read seb: 

20 FD_SET(STDIN_FILENO. &read set); 

21 FD_SET(listen_sock., &read_set): 

22 

23 while (1) { 

24 Teady_set = read set; 

25 select(listen_sock+]1, &ready_set, NULL, NULL. NULL): 
26 if (FD_ISSET(STDIN_FILENO,. &ready_set)) 

27 Tead_inputO; /* read and process input from stdin */ 
28 if (FD _ISSET(listen_sock, &ready seb) { 

29 conn sock = accept(listen_sock, (SA *)&clientaddr. &clientlen): 
30 toggle(conn sock): /* toggle and send back client input */ 
31 close(conn_sock): 

32 } 

33 } 

34 } 

3 

36 void read_input(void) { 

37 char buf[ MAXLINE]: 

38 if(tfgets(buf MAXLINE. stdin)) 

39 exit(0): EOF*/ 

40 printf("%s", buf): /* Process the input command */ 

41 } 


程序 首先 在 第 17 行 调用 open_listen_sock 函数 以 打开 一 个 监听 描述 符 ， 然 后 在 第 19 行使 用 宏 


FD_ZERO 创建 一 个 空 的 读 描 述 符 集合 : 


大 
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listen_sock stdin 
1 0 


read_set(0) [ololol ol 
接 下 来 ， 第 20 和 21 行 定义 由 描述 符 0( 标 准 输 入 ) 和 描述 符 3( 监 听 描 述 符 ) 组 成 的 读 集 合 : 


listen_sock stdin 
1 0 


read_set({0,3}) [5 | o | 


往 下 进入 服务 器 循环 。 在 这 里 不 调用 accept 函数 等 待 连接 请 求 , 而 是 在 第 25 行 调用 select 函数 ， 
同时 等 待 连接 请 求 和 用 户 输入 ,该 函数 一 直 阻塞 , 直到 监听 描述 符 或 标准 输入 准备 好 可 以 读 。 例 如 ， 
当 用 户 输入 一 行文 本 并 按 回 车 键 ， 使 得 标准 输入 描述 符 变 为 可 读 时 ，select 函数 返回 并 将 ready_set 
的 值 修改 为 如 下 所 示 : 


listen_sock stdin 
3 2 1 0 


read_set({0}) [ololofi| 


之 后 , 用 FD _ISSET 宏 指 令 判断 ready_set 中 的 哪个 描述 符 准备 就 绪 可 以 读 。 如 果 是 标准 输入 准 
备 就 绪 (第 26 行 )， 就 调用 read_input 函数 ， 该 函数 读 取 、 解 析 和 执行 命令 。 如 果 是 监听 描述 符 准备 
好 了 (第 28 行 )， 就 调用 accept 函数 ， 得 到 一 个 已 连接 描述 符 ， 然 后 调用 toggle 函数 ， 对 来 自 客户 端 
的 文本 行进 行 大 小 写 取 反 后 送 回 ， 直 到 客户 端 关 闭 连接 的 一 端 。 

togglessl.c 展示 了 如 何 使 用 select 函数 同时 等 待 多 个 IO 事件 ， 可 以 按 前 面 的 方法 编译 和 执行 ， 
以 验证 其 正确 性 。 但 我 们 不 难 从 输出 结果 中 发 现 ， 该 程序 仍 有 迭代 式 服 务 程 序 存在 的 共同 问题 : 一 
且 服 务 器 连接 到 某 个 客户 端 ， 就 会 处 理 该 客户 端的 请 求 ， 直 到 该 客户 端 关 闭 连 接 ， 若 此 时 通过 服务 
器 的 键盘 键入 命令 ， 就 不 会 得 到 响应 ， 直 到 服务 器 和 客户 端 之 间 通 信 结 束 。 解 决 办 法 是 使 用 更 细 粒 
度 的 多 路 复 用 ， 如 服务 器 每 次 仅 处 理 来 自 客户 端的 一 次 请 求 ， 下 面 对 此 继续 讨论 。 

咯 ” 思考 与 练习 题 9.3 在 大 多 数 UNIX 系统 中 ， 在 标准 输入 中 键入 ClHD 表示 EOF。 分 析 
togglessl.c 的 源 代码 ， 当 程序 被 阻塞 在 对 select 函数 的 调用 上 时 ,如 果 键 入 CtrlHD 会 发 生 什么 ? 
请 运行 验证 。 


*9.2.2 ”基于 IO 多 路 复 用 实现 事件 驱动 服务 器 


让 服务 器 每 次 仅 处 理 一 个 客户 端 请 求 或 JO 事件 ， 实 际 上 就 是 一 种 事件 驱动 (event-driven) 模 式 。 
服务 器 使 用 IO 多 路 复 用 ,借助 select 函数 检测 IO 事件 的 发 生 ， 这些 IO 事件 不 但 包括 键盘 输入 事 
件 和 客户 端 连接 事件 ， 还 包括 与 客户 端的 数据 传输 事件 。 事 件 驱动 服务 器 的 一 般 处 理 流程 是 ， 主 程 
序 调 用 select 函数 检查 事件 是 否 发 生 ， 一 旦 有 事件 发 生 就 处 理事 件 ， 然 后 尽快 返回 检测 事件 。 

下 面 的 toggless2.c 是 基于 事件 驱动 实现 toggle 服务 器 的 代码 文件 。 活 动 客户 端的 集合 记录 在 
sock pool 结构 体 (第 3~10 行 ) 中 。 在 调用 init_sock pool 初始 化 活动 客户 端的 集合 (第 30 行 ) 之 后 ， 服 
务 器 进入 一 个 无 限 循环 。 在 每 次 循环 迭代 中 ， 服 务 器 调用 select 函数 来 检测 两 种 输入 事件 : 来自 新 
客户 端的 连接 请 求 到 达 ， 以 及 已 连接 套 接 字 准 备 就 绪 。 当 一 个 连接 请 求 到 达 时 (第 37 行 )， 服 务 器 接 
收 连接 (第 38 行 )， 并 调用 add_sock 函数 ， 将 该 客户 端 添 加 到 sock pool 中 (第 39 行 )。 最 后 ， 服 务 器 


和 :4 
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调用 serve_clients 函数 ， 处 理 从 已 连接 描述 符 传 来 的 数据 (第 43 行 )。 


上 # 基于 IO 多 路 复 用 的 并 发 toggle 服务 器 程序 ，toggless2.c 每 次 服务 器 迭代 都 回 送 来 自 每 个 准备 好 的 描述 符 的 
文本 行 ， 编 译 命令 为 
gcc toggless2.c togglec -0 toggless2 -L. 一 wrapper #/ 


i #include "wrapper.h" 

3 typedef struct { /* represents a pool of connected descriptors */ 
4 int maxfd: /* largest descriptor in read_set */ 

加 fd_set read_set:; /* set of all active descriptors */ 

6 fd setready set: /* subset of descriptors ready for reading */ 

于 intnready: /* number of ready descriptors from select */ 

8 int maxi; /* highwater index into client array */ 

9 int client_sock[FD_SETSIZE]: /* set of active descriptors */ 


10 } sock_pool: 


12 Void init_sock_pool(int listen_sock, pool *pool) 
13 void add sock(int conn_sock, pool *poo]): 


14 Void serve_clients(client pool *pool): 

15 

16 int main(int argc, char **argv) 

7 { 

18 int listen_sock, conn_sock, port: 

19 socklen t clientlen = sizeoflstruct sockaddr in): 

20 struct sockaddr in clientaddr: 

21 static sock_pool pool: 

22 

23 这 (argc ! 王 2){ 

24 fprintf(stderr, "usage: %s <port>\n", argv[0]); 

25 exit(1); 

26 } 

27 port = atoi(argv[1]); 

28 

29 listen_sock = open_listen_sock(port); 

30 init_sock_poo(listen_sock, &pool): 

31 while (1) { 

3 * Wait for listening/connected descriptor(s) to become ready */ 
33 pool.ready_set = pool.read_set: 

34 pool.nready = select(pool.maxfd+1, &poolready_set NULL. NULL. NULL): 
35 

36 /* If listening descriptor ready. add new client to pool */ 

37 if (FD ISSET(listen sock. &pool.ready set)) { 

38 conn sock = accept(listen_sock., (SA *)&clientaddr &clientlen): 
39 add_sock(conn sock. &pool): 

40 } 

41 

42 /* get a text line from a ready connected descriptor. toggle it and send back */ 
43 serve_clients(&pool): 

44 } 
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站 

init sock pool 函数 用 于 初始 化 活动 客户 端 池 。client sock 数组 表示 已 连接 描述 符 的 集合 ， 元 素 
值 为 - 1 表示 一 个 可 用 的 空闲 单元 。 初 始 时 ， 已 连接 套 接 字 的 集合 为 空 (第 5~7 行 )，select 读 集合 仅 
包含 监听 描述 符 ( 第 10~12 行 )。 


/* toggless2.c 用 于 初始 化 客户 端 池 init_sock_ pool 函数 代码 */ 
1 Void init_sock_pool(int listen_sock, sock pool *p) 

2 

3 /* Initially, there are no connected descriptors */ 

4 int i: 

> p->maxi= -1; 

6 for (i=0:; i< FD_SETSIZE:; i++) 

7 p->client sock[i] =-1: 

8 

9 /* Initially, listen_sock is only member of select read set */ 
10 p->maxfd = listen_sock: 

11 FD _ ZERO(&p->read set): 
12 FD_SET(listen_sock, &p->read_set); 
13 } 


add_sock 函数 用 于 添加 一 个 新 的 客户 端 到 活动 客户 端的 集合 client_pool 中 。 在 client sock 数组 
中 找到 一 个 空闲 单元 后 (第 6 行 )， 服 务 器 将 这 个 已 连接 描述 符 添加 到 数组 中 (第 8 行 )。 然 后 ， 将 这 个 
已 连接 描述 符 添 加 到 select 合 (第 11 行 )， 并 更 新 client_ pool 的 一 些 全 局 属性 。maxfd 变量 (第 14 
和 第 15 行 ) 记 录 了 select 的 最 大 文件 描述 符 。maxi 变量 (第 16 和 17 行 ) 记 录 的 是 到 client_sock 数组 的 
最 大 索引 ， 这 样 serve_clients 函数 就 不 用 搜索 整个 数组 了 。 


让 toggless2.c 用 于 向 池 中 添加 一 个 新 的 客户 端 连 接 的 add_client 函数 的 源 代 码 */ 
1 Void add_sock(int conn_sock. sock_pool *p) 

2 

和 inti; 

4 Pp->nready--; 

5 for (i=0:i<FD SETSIZE: i++) /* Find an available free cell */ 
6 if (p->client_sock[i] <0) { 

eh /* Add connected descriptor to the pool */ 

8 p->client_sock[i] = conn_sock: 

加 

10 /* Add the descriptor to descriptor set */ 

11 FD_SET(conn sock, &p->read_seb: 

12 

13 * Update max descriptor and pool highwater mark */ 

14 if (conn sock > p->maxfd) 

15 Pp->maxfd = conn_sock: 

16 if (i>p->maxi) 

1 Pp->maxi=i: 

18 break: 

19 } 
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if(i—FD SETSIZE) /* Couldn't find an empty cell */ 


perror("add client error: Too many clients"): 


serve_clients 函数 处 理 来 自 每 个 已 连接 描述 符 的 请 求 。 它 从 描述 符 读 取 文本 行 ， 将 大 小 写 反 转 ， 
送 到 客户 端 (第 13 行 )。 如 果 客户 端 关闭 其 套 接 字 ， 服 务 器 将 检测 到 EOF， 然 后 关闭 服务 端 套 接 字 
(第 17 行 )， 最 后 从 client_sock 中 清除 这 个 描述 符 (第 18 和 第 19 行 )。 


EE 


/#*toggless2.c 用 于 已 连接 客户 端 请 求 的 serve_clients 函数 的 源 代码 */ 
Void serve_clients(sock pool *p) 

2 { 

3 int i, conn_sock, n; 

4 char buf[MAXLINE]: 

:1 

6 for (i= 0; (i <= p->maxi) && (p->nready > 0): i++) { 

党 conn_sock = p->client_sock[i]; 

8 

9 /* If the descriptor is ready. echo a text line from it #/ 
10 if ((conn sock> 0) && (FD _ISSET(conn sock, &p->ready_ set))) { 
11 Pp->nready--; 

12 

13 toggle(conn_sock): 

14 

1 /|* EOF detected, remove descriptor from pool */ 
16 else { 

17 close(conn_sock): 

18 FD_CLR(conn sock, &p->read_set); 

19 Pp->client_sock[i] = -1: 

20 } 

21 } 

22 } 

23 } 


现在 toggless2.c 能 够 及 时 响应 和 处 理 来 自 每 个 客户 端的 请 求 ， 可 用 前 面 的 方法 测试 程序 的 正 
确 性 。 

基于 IO 多 路 复 用 的 事件 驱动 服务 器 有 很 多 好 处 : 首先 是 运行 在 单一 进程 上 下 文中 ， 每 个 逻辑 
流 都 能 访问 该 进程 的 全 部 地 址 空间 ， 在 流 之 间 共享 数据 变 得 很 容易 ， 其 次 ， 单 进程 运行 还 可 以 利用 
GDB 等 熟悉 的 调试 工具 ,调试 并 发 服务 器 最后， 事件 驱动 设计 相 比 基 于 进程 的 设计 ， 具 有 更 高 的 
效率 ， 不 需要 进行 进程 上 下 文 切换 来 调度 新 的 流 。 
事件 驱动 设计 的 缺点 也 很 明显 : 首先 是 编码 复杂 ， 代 码 量 大 ， 复 杂 性 随 并 发 粒度 减 小 而 增 
大 ; 其 次 ， 相 比 多 进程 编程 方式 脆弱 ， 在 示例 程序 中 ， 若 恶意 客户 “故意 只 发 送 部 分 文本 行 ， 然 
后 就 停止 ”， 也 会 导致 拒绝 服务 ; 最后， 事件 处 理 不 能 并 行 执行 ， 难 以 发 挥 多 核 处 理 器 的 并 行 运 
算 能 力 。 
好 = 思考 与 练习 题 94 在 togglessl2.c 的 源 代码 中 ,我 们 在 每 次 调用 select 函数 之 前 都 立即 用 语 
多 “poolready_set= poolread_set” 重 新 初始 化 poolready_set 变量 ， 这 是 为 什么 ? 
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基于 线程 的 并 发 编程 


前 面 介绍 了 两 种 创建 并 发 逻辑 流 的 方法 。 基 于 多 进程 方法 为 每 个 请 求 客户 创建 单独 进程 ， 内 核 


会 自动 调度 每 个 进程 ， 每 个 进程 有 自己 的 私有 地 址 空间 ， 但 逻辑 流 共享 数据 很 困难 。 基 于 IO 多 路 
复 用 方法 可 在 单 进程 中 同时 等 待 多 个 事件 发 生 ， 所 有 的 流 共享 整个 地 址 空间 ， 但 控制 和 编程 复杂 ， 
而 且 事 件 不 能 并 发 处 理 。 基 于 线程 的 逻辑 流 结合 了 基于 进程 和 基于 IO 多 路 复 用 的 两 种 流 的 特性 。 
线程 由 内 核 自动 调度 ， 并 发 执行 ， 可 利用 多 处 理 器 强大 的 处 理 能 力 ， 而 且 编 程控 制 直观 方便 。 同 基 
于 IO 多 路 复 用 的 流 一 样 ， 多 个 线程 运行 在 单一 进程 的 上 下 文中 ， 共 享 进程 虚拟 地 址 空间 的 所 有 内 
容 ， 包 括 代 码 、 数 据 、 堆 、 共 享 库 和 打开 的 文件 。 


9.3.1 ”基于 线程 的 并 发 toggle 服务 器 


在 


下 面 给 出 了 基于 线程 的 并 发 toggle 服务 器 的 代码 实现 。 整 体 结构 与 基于 进程 的 代码 实现 相似 : 
E 打 开 侦 听 套 接 字 ( 第 18 行 ) 后 ， 主 线程 不 断 地 等 竺 连接 请 求 (第 21 行 ), 然后 创建 一 个 对 等 线程 来 处 


理 该 请 求 (第 22 行 )。 


尾 togglestc: 基 于 线程 的 toggle 并 发 服务 器 */ 
#include "wrapper.h" 


2 Void toggle(int conn_sock): 

3 Void *serve_client(void *vargp); 

4 

5 int main(int argc, char **argv) 

6 { 

7 int listen_sock, *conn_sock_p, port; 

8 Socklen_t clientlen=sizeoflstruct sockaddr in): 

9 struct sockaddr in clientaddr: 

10 pthread ttid: 

11 

12 if(argc (=2) { 

3 fprintf(stderr, "usage: %s <port>\n", argv[0]): 
14 exit(1); 

15 } 

16 port = atoi(argv{[1]): 

地 

18 listen_sock = open_listen_sock(port): 

19 while (1) { 

20 conn sock p = malloc(sizeof(int)); 

2 *conn sock p=accept(listen sock, (SA *) &clientaddr, &clientlen): 
22 pthread_create(&tid, NULL., serve_client, conn_sock p): 
23 } 

24 人 

25 

26 /* thread routine */ 

2 void * serve_client (void *vargp) 

28 人 

29 int conmn sock = *((int *)vargp): 

30 pthread detach(pthread selfO); 
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31 free(vargp); 

32 toggle(conn sock): 
3 close(conn sock): 
34 Tetum NULL: 

35 

编译 命令 为 : 


gcc -0 togglest togglestc togglec -L. -lwrapper -lpthread 

阅读 tooglest.c 的 源 代码 时 ， 有 三 点 需要 注意 : 

(1) 为 防止 出 现 类 似 6.7.4 节 中 的 竞争 ， 为 每 个 accept 函数 返回 的 已 连接 描述 符 分 配 一 个 专用 的 
动态 分 配 存 储 器 块 ， 将 描述 符 指针 conn_sock_p 作为 参数 传递 给 线程 函数 serve_client( 第 22 行 )。 

(2) 线程 函数 serve_client 从 参数 vargp 中 读 出 已 连接 描述 符 conn_sock 后 ， 在 第 31 行将 已 连接 
描述 符 的 专用 内 存 块 释放 掉 ， 以 避免 内 存 泄漏 。 

(3) 线程 函数 在 第 30 行 调 用 pthread_detach 将 自身 分 离 ,， 这 样 就 不 用 主线 程 调用 pthread join 来 
等 待 其 结束 并 清理 之 ， 而 是 在 终止 时 自动 将 所 有 资源 归还 系统 ， 由 系统 对 其 进行 清理 。 
弛 ”思考 与 练习 题 9.5 ”在 基于 进程 的 服务 器 中 ， 我 们 在 两 个 位 置 小 心地 关闭 已 连接 描述 符 : 父 
进程 和 子 进 程 。 然 而 ， 在 基于 线程 的 服务 器 中 ， 我 们 只 在 一 个 位 置 关闭 已 连接 描述 符 : 对 等 线 
程 。 这 是 为 什么 ? 
思考 与 练习 题 9.6 如果 我 们 在 调用 pthread create 时 ， 直 接 将 已 连接 描述 符 指针 传递 给 线程 : 

(listen_sock, (SA*) &clientaddr, &clientlen) : 

Pthread_create(&tid, NULL. serve_client, &conn_sock): 

让 对 等 线程 间接 引用 这 个 指针 ， 并 将 它 赋值 给 一 个 局 部 变量 : 


void serve_client (void* argp) { 
int conn_sock =*((int *)vargp): 


} 
这 样 编写 代码 有 何 问 题 ? 如 果 有 问题 ， 给 出 一 种 导致 错误 的 执行 序列 和 错误 结果 。 


9.3.2 ”基于 预 线程 化 的 并 发 服务 器 


让 并 发 服务 器 为 每 一 个 新 的 请 求 客户 端 创建 一 个 新 线程 ， 这 种 方法 虽然 开销 远 低 于 创建 进程 ， 
但 当 连 接 请 求 多 而 频繁 时 , 开销 仍 不 可 小 遍 。 解决 这 个 问题 的 一 种 方法 是 使 用 预 线程 化 (prethreading) 
技术 ， 预 先 创建 一 批 工作 者 线程 ， 当 主线 程 每 次 成 功 建立 与 客户 端的 连接 时 ， 就 分 派 一 个 工作 线程 
专门 服务 该 客户 , 通信 结束 时 并 不 撤销 线程 ， 而 是 让 线程 继续 处 于 待命 状态 , 准备 接受 下 一 次 任务 。 

预 线程 化 并 发 编程 可 以 针对 特定 应 用 进行 定制 化 设计 ,但 最 好 设计 成 与 应 用 无 关 的 结构 或 模块 ， 
以 方便 开发 具体 应 用 时 借鉴 甚至 直接 调用 。 图 9-5 是 基于 预 线程 化 服务 器 的 一 种 工作 模型 。 服 务 器 
由 一 个 主线 程 和 一 组 工作 者 线程 构成 。 主 线程 不 断 地 接收 来 自 客户 端的 连接 请 求 ， 并 将 得 到 的 连接 
描述 符 放 在 一 个 任务 池 (task pooD 中 。 每 一 个 工作 者 线程 反复 地 从 任务 池 中 取出 描述 符 ， 为 客户 端 服 
务 ， 然 后 等 待 下 一 个 描述 符 。 在 这 里 ， 任 务 池 实 际 上 是 一 个 具有 同步 机 制 的 有 限 缓冲 区 ， 这 样 主线 
程 和 工作 者 线程 就 形成 一 种 生产 者 /消费 者 关系 。 
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图 9-5 ” 预 线 程 化 并 发 服务 器 的 结构 。 一 组 现 有 线程 不 断 地 取出 和 处 理 来 自任 务 池 的 已 连接 描述 符 


1. 任务 池 的 结构 


头 文件 taskpoolh 展示 了 任务 池 task pool t 的 结构 ， 它 有 一 个 含 cnt 个 元 素 的 数组 socks， 通 过 
写 指针 inpos、 读 指针 outpos 构成 一 个 循环 队列 ， 定 义 两 个 同步 信号 量 avail、ready 和 一 个 互 斥 信号 
量 mutex， 用 于 保证 各 线程 正确 操作 socks 数组 。 


/* taskpool.h */ 
1 typedef struct { 
有 int *socks; /* Buffer array */ 
3 int cnt; * Maximum number of cell */ 
4 int inpos; /* buffinpos] is first available cell */ 
5 int outpos; /* buffoutpos] is fist item */ 
6 sem _t mutex; /* Protects accesses to socks */ 
7 Sem_t avail; /* Counts available cells */ 
8 sem t ready:; /* Counts ready items */ 
9 } task_pool t: 


源 文 件 taskpool.c 定义 了 对 task_pool 的 四 种 主要 操作 : 初始 化 task_pool init、 插 入 描述 符 


task_insert、 取 出 描述 符 task_ remove、 绥 冲 区 


清理 task pool deinit。 下 面 的 代码 给 出 了 task_pool init 


与 insert task 操作 的 实现 。 这 是 一 个 非常 典型 的 生产 者 /消费 者 缓冲 区 。task pool init 负责 申请 内 存 
块 以 创建 数组 socks， 初 始 化 元 素 个 数 cnt、 缓 冲 区 指针 outpos 与 npos， 初 始 化 互 斥 信号 量 mutex 
及 同步 信号 量 avail 与 ready。task_insert 要 先 对 同步 信号 量 avail 执行 P 操作 ， 等 待 空闲 单元 (第 13 


行 )， 再 请 求 对 缓冲 区 加 锁 (第 14 行 )， 之 后 才 


能 将 描述 符 放 入 task pool， 并 调整 tail 指针 (第 15 和 第 


16 行 )， 之 后 要 解锁 ， 对 同步 信号 量 ready 执行 V 操作 (第 17 和 第 18 行 )。 阅 读 task_pool.c 的 其 他 代 
码 ， 不 难 理解 task_remove 与 task_ pool deinit 的 实现 。 


/# 任务 池 源 程序 文件 taskpool.c */ 


1 void task_pool_init(task_pool _t *tp, int n) 

2 

3 tp->socks = calloc(n, sizeof(int)): 

4 tp->cnt =n; |* socks holds max of n items */ 

-1 tp->outpos = tp->inpos = 0: /* Empty socks iff inpos=——=outpos */ 

6 sem init(&tp->mutex, 0. 1): /* Binary semaphore for locking */ 

be sem init(&tp->avail. 0. tp->cnt): /* Initially, socks has cnt empty cell */ 
8 sem init(&tp->ready., 0. 0): /* Initially, socks has zero data items */ 
9 } 

10 

11 Void task_insert (task pool t *tp, int item) 

12 { 

13 sem wait(&tp->avail): /* Wait for available cell */ 
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14 sem wait(&tp->mutex): /* Lock the shared variable inpos pointer */ 
15 tp->socks[tp->inpos] = item: /* Insert the item */ 

16 tp-> inpos =(tp-> inpos +1)%(tp->cnt): /* adjuset inpos point */ 

1 sem post(&tp->mutex): /* Unlock the buffer */ 

18 sem post(&tp->ready): /* Announce available item */ 

19 } 


轨 和 思考 与 练习 题 9.7 ”函数 task insert 和 task remove 是 线程 安全 函数 吗 ? 是 可 重 入 函数 吗 ? 
为 什么 ”人 删 去 对 信号 量 mutex 的 P/V 操作 之 后 呢 ? 


2. 预 线程 化 并 发 toggle 服务 器 的 实现 


下 面 展 示 了 预 线程 化 并 发 toggle 服务 器 的 源 代 码 。 在 初始 化 缓冲 区 task_pool( 第 23 行 ) 后 ,主线 
程 创建 了 一 组 工作 者 线程 (第 26 和 27 行 )， 然 后 进入 无 限 循环 ， 接 收 连接 请 求 ， 将 得 到 的 已 连接 描 
述 符 插入 到 任务 池 task_pool 中 。 工作 者 线程 的 行为 非常 简单 ， 只 是 在 任务 池 中 取出 一 个 已 连接 描述 
符 (第 38 行 )， 然 后 调用 toggle 函数 回 送 客户 端的 输入 。 


/* togglest_ pre.c */ 
Li #include "wrapperh" 
2 #include "task poolh" 
| #define NTHREADS 4 
4 #define SBUFSIZE 16 
> 
6 Void toggle(int conn_sock): 
Void *serve_client(void *vargp): 
8 
9 task_pool t tp; /* task pool: shared buffer of connected descriptors */ 
10 
11 int main(int argc., char **argv) 
12 { 
13 inti, listen_sock, conn_sock, port: 
14 socklen _t clientlen=sizeof(struct sockaddr in): 
15 struct sockaddr_in clientaddr: 
16 pthread_t tid; 
17 
18 if(argc (=2){ 
19 fprintf(stderr, "usage: %s <port>\n", argv[0]): 
20 exit(1): 
21 } 
22 port = atoilargv[1]): 
23 task pool init(&tp, SBUFSIZE): 
24 listen_sock = open_listen_sock(port): 
25 
26 for(i=0:i<NTHREADS:i++) /* Create worker threads */ 
27 pthread_create(&tid, NULL. serve_client NULL): 
28 
29 while (1) { 
30 conn sock = accept(listen_sock., (SA *) &clientaddr &clientlen): 
31 task_insert(&tp. conn sock): /* Insert conn_ sock in task pool */ 
32 i 
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33 } 

34 void * serve_client(void *vargp) 

35 { 

36 pthread detach(pthread_selfO): 

37 while () { 

38 int conn sock = task remove(&tp): /* Removea task from task pool */ 
39 toggle(conn_ sock): /* Serve client */ 

40 close(conn sock):; 

41 } 

42 


将 预 线程 化 并 发 服务 器 的 源 代码 编译 成 可 执行 程序 togglest_pre 的 方法 如 下 : 

S$gcc -0 togglest pre togglest pre.c task pool.c toggle.c 

-L. -Wwrapper -lpthread 
线 思考 与 练习 题 9.8 ” 试 说 明 本 节 的 两 段 示例 程序 中 网 络 连接 分 发 是 一 种 典型 的 生产 者 /消费 
者 问题 。 


到 本 章 小 结 


并 发 程序 由 时 间 上 重 麦 的 一 组 逻辑 流 组 成 ， 一 般 构建 并 发 程序 有 三 种 方法 : 多 进程 、IO 多 路 
复 用 和 多 线程 。 进 程 是 由 内 核 自动 调度 的 ， 有 各 自 独立 的 虚拟 地 址 空间 ， 要 实现 数据 共享 ， 必 须 通 
过 IPC 机 制 创建 共享 内 存 。IO 多 路 复 用 可 创建 自己 的 并 发 逻辑 流 ， 程 序 运行 在 单一 进程 中 ， 流 之 
间 共 享 数据 方便 、 效 率 高 。 线 程 机 制 综合 了 进程 和 IO 多 路 复 用 的 优点 。 

本 章 介 绍 了 基于 进程 、IO 多 路 复 用 和 线程 开发 并 发 服务 器 的 基本 方法 ， 以 toggle 服务 器 作为 
案例 进行 讲授 ， 将 weblet 服务 器 的 并 发 版 本 开发 作为 作业 ， 有 助 于 对 基于 进程 、IO 多 路 复 用 和 线 
程 的 并 发 编程 进行 训练 。 


课 后 作业 


8 * 思 考 与 练习 题 9.9 ”事件 驱动 的 并 发 服务 器 togeless2. 存 在 缺陷 : 恶意 的 客户 端 能 够 通过 发 送 部 
分 文本 行 ， 使 服务 器 拒绝 为 其 他 客户 端 服务 。 编 写 一 个 改进 的 服务 器 版 本 ， 以 非 阻塞 方式 处 理 部 分 
文本 行 。 

虽 ” 思考 与 练习 题 9.10 ”仿照 togglesp.c， 实 现 一 个 基于 进程 的 weblet 服务 器 并 发 版 本 ， 为 每 一 个 
新 的 连接 请 求 创建 一 个 新 的 子 进程 ， 使 用 浏览 器 进行 验证 。 

要 = 思考 与 练习 题 9.11 仿照 toggless2.c, 实现 一 个 基于 IO 多 路 复 用 的 weblet 服务 器 并 发 版 本 。 
使 用 浏览 器 和 Telnet 工具 进行 验证 。 

绢 ”思考 与 练习 题 9.12 仿照 togglestc， 实 现 一 个 基于 线程 的 weblet 服务 器 并 发 版 本 ， 为 每 一 
个 新 的 连接 请 求 创建 一 个 新 的 线程 ， 使 用 浏览 器 进行 验证 。 

$$ 思考 与 练习 题 9.13 仿照 togglest pre.c, 实现 一 个 基于 预 线程 化 技术 的 weblet 服务 器 并 发 版 
本 ， 使 用 浏览 器 进行 验证 。 


和 :54 
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弗 思考 与 练习 题 9.14 实现 一 个 支持 负载 均衡 的 基于 预 线程 化 技术 的 weblet 服 务 器 并 发 版 本 ， 
根据 当前 负载 动态 地 增加 或 减少 线程 的 数目 ,设计 一 个 Web 客户 端 程序 进行 验证 。 负 载 均衡 编 
程 参 考 策略 : 当 缓冲 区 变 满 时 ， 自 动 将 线程 数量 翻 倍 ; 而 当 缓 冲 区 变 为 空 时 ， 自 动 将 线程 数目 


和 * 思 考 与 练习 题 9.15 ”查阅 phread_once 函数 的 语义 ， 阅 读 下 面 的 程序 代码 ， 给 出 输出 结果 。 


#include “wrapper.h" 
static void init (void) 

Printf("this thread init action\n"): 
} 


void *thread(void *arg) 

{ 
static pthread_once t once = PTHREAD_ ONCE _INIT: 

pthread_once(&once, init): 

printf("this is thread action\n"); 

} 

int main() 

{ 
pthread tt1,t2; 
pthread_create(&t1,NULL .thread,NULL): 
pthread_create(&t2,NULL ,thread,NULL): 
pthread_join(tl,NULL): 
Ppthread_join(t2,NULL): 

} 


哆 “思考 与 练习 题 9.16 Web 代理 是 在 Web 服务 器 和 浏览 器 之 间 扮 演 中 间 角 色 的 程序 。 浏 览 
器 不 是 直接 连接 服务 器 以 获取 网 页 ， 而 是 与 代理 连接 ， 代 理 再 将 请 求 转发 给 服务 器 。 当 服务 器 
响应 代理 时 ， 代 理 将 响应 发 送 给 浏览 器 。 请 编写 一 个 简单 的 可 以 过 滤 和 记录 请 求 的 Web 代理 。 


A. 基本 要 求 : 接收 浏览 器 请 求 ， 分 析 HTTP， 转 发 请 求 给 服务 器 ， 并 且 返 
理 将 所 有 请 求 的 URL 记录 到 磁盘 上 的 一 个 日 志文 件 中 。 


回 结果 给 浏览 器 。 代 


B. 高 级 要 求 : 升级 代理 ， 通 过 派生 一 个 独立 的 线程 来 处 理 每 一 个 请 求 ， 使 得 代理 能 够 一 次 处 理 


多 个 打开 的 连接 。 当 代理 在 等 待 远程 服务 器 响应 一 个 请 求 来 服务 一 个 浏览 器 时 
另 一 个 浏览 器 未 完成 的 请 求 。 使 用 实际 的 浏览 器 来 检验 程序 的 正确 性 。 


， 代 理 可 以 处 理 来 自 
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